跳到主要内容

部署 Node Exporter

何时需要本文档

单机模式(Docker Compose)和 Kubernetes 集群内的节点不需要本文档——ops-nodeagent 服务已内置 Node Exporter,自动监听 :59100 采集所在节点指标。重复部署会导致端口冲突。

只有需要额外监控运维平台部署节点之外的服务器(如独立的数据库节点、缓存节点等)时,才在那些节点上按下文部署 Node Exporter,并把它们的 IP 加入 ENV_PROMETHEUS_HOST 环境变量。

  1. 下载并解压 Node Exporter 至安装目录

    wget https://pdpublic.mingdao.com/private-deployment/offline/common/node_exporter-1.3.1.linux-amd64.tar.gz
    tar xvf node_exporter-1.3.1.linux-amd64.tar.gz
    mv node_exporter-1.3.1.linux-amd64 /usr/local/node_exporter
  2. 创建 Systemd 服务文件

    cat > /etc/systemd/system/node_exporter.service <<'EOF'
    [Unit]
    Description=Node Exporter
    Documentation=https://prometheus.io/docs/guides/node-exporter/
    After=network.target

    [Service]
    User=root
    Group=root
    Type=simple
    ExecStart=/usr/local/node_exporter/node_exporter --web.listen-address=:59100
    Restart=always
    RestartSec=3
    SyslogIdentifier=node_exporter

    [Install]
    WantedBy=multi-user.target
    EOF
  3. 启动服务

    systemctl daemon-reload
    systemctl start node_exporter
    systemctl enable node_exporter
  4. 检查服务状态

    systemctl status node_exporter
  5. 在运维平台的 ops.yaml / ConfigMap 中将新节点 IP 加入 ENV_PROMETHEUS_HOST,多个节点用逗号分隔。示例:

    ENV_PROMETHEUS_HOST: "hap_1/192.168.1.12:59100,extra_node_01/192.168.1.20:59100"