监控 RisingWave 集群
如果在 Kubernetes 集群中运行 RisingWave,您可以监控其性能,包括 CPU、内存、网络的使用情况以及不同节点的状态。
安装监控堆栈
要监控 RisingWave 集群,您可以使用 RisingWave-Operator
存储库中的监控堆栈。该堆栈包括用于收集数据的 Prometheus,用于可视化和预警的 Grafana,以及其他必要资源。
将 RisingWave-Operator
仓库下载到您的环境:
git clone https://github.com/risingwavelabs/risingwave-operator.git
运行脚本以安装监控堆栈。这将创建monitoring
命名空间并在该命名空间中部署所有监控服务。
./monitoring/install.sh
启动监控
RisingWave operator 现在已经和 Prometheus operator 集成完毕。Prometheus operator 会为 RisingWave 创建服务监视器,并确保自动收集数据。
检查 Prometheus 是否正在从 RisingWave 收集数据:
kubectl get servicemonitors -A -l risingwave/name
预期输出如下:
NAMESPACE NAME AGE
monitoring risingwave-service-monitor 119m将 Grafana 的 Web 端口转发到本地:
kubectl port-forward -n monitoring svc/prometheus-grafana 3000:http-web
以上命令只允许从本地机器访问 Grafana。如果需要从其他主机访问 Grafana,请在命令后追加--address 0.0.0.0
,以允许 Grafana 接受来自外部主机的请求。完整的命令如下:
kubectl port-forward -n monitoring svc/prometheus-grafana 3000:http-web --address 0.0.0.0
如果从本地机器访问 Grafana,请转到http://localhost:3000,如果从其他主机访问 Grafana,请转到
http://<client_address>:3000
,其中<client_address>
是运行 Grafana 服务的机器的 IP 地址。默认用户名为admin
,密码为prom-operator
。在 Dashboards 界面选择 RisingWave -> RisingWave Dashboard 以编辑指标并添加指标。