Skip to main content

监控 RisingWave 集群

如果在 Kubernetes 集群中运行 RisingWave,您可以监控其性能,包括 CPU、内存、网络的使用情况以及不同节点的状态。

安装监控堆栈

要监控 RisingWave 集群,您可以使用 RisingWave-Operator 存储库中的监控堆栈。该堆栈包括用于收集数据的 Prometheus,用于可视化和预警的 Grafana,以及其他必要资源。

RisingWave-Operator 仓库下载到您的环境:

git clone https://github.com/risingwavelabs/risingwave-operator.git

运行脚本以安装监控堆栈。这将创建monitoring命名空间并在该命名空间中部署所有监控服务。

./monitoring/install.sh

启动监控

RisingWave operator 现在已经和 Prometheus operator 集成完毕。Prometheus operator 会为 RisingWave 创建服务监视器,并确保自动收集数据。

  1. 检查 Prometheus 是否正在从 RisingWave 收集数据:

    kubectl get servicemonitors -A -l risingwave/name

    预期输出如下:

    NAMESPACE    NAME                         AGE
    monitoring risingwave-service-monitor 119m
  2. 将 Grafana 的 Web 端口转发到本地:

    kubectl port-forward -n monitoring svc/prometheus-grafana 3000:http-web

以上命令只允许从本地机器访问 Grafana。如果需要从其他主机访问 Grafana,请在命令后追加--address 0.0.0.0,以允许 Grafana 接受来自外部主机的请求。完整的命令如下:

kubectl port-forward -n monitoring svc/prometheus-grafana 3000:http-web --address 0.0.0.0
  1. 如果从本地机器访问 Grafana,请转到http://localhost:3000,如果从其他主机访问 Grafana,请转到 http://<client_address>:3000,其中 <client_address> 是运行 Grafana 服务的机器的 IP 地址。默认用户名为admin,密码为prom-operator

  2. Dashboards 界面选择 RisingWave -> RisingWave Dashboard 以编辑指标并添加指标。

    RisingWave Dashboard in Grafana