部署 Node Exporter
何时需要本文档
单机模式(Docker Compose)和 Kubernetes 集群内的节点不需要本文档——ops-nodeagent 服务已内置 Node Exporter,自动监听 :59100 采集所在节点指标。重复部署会导致端口冲突。
只有需要额外监控运维平台部署节点之外的服务器(如独立的数据库节点、缓存节点等)时,才在那些节点上按下文部署 Node Exporter,并把它们的 IP 加入 ENV_PROMETHEUS_HOST 环境变量。
-
下载并解压 Node Exporter 至安装目录
wget https://pdpublic.mingdao.com/private-deployment/offline/common/node_exporter-1.3.1.linux-amd64.tar.gz
tar xvf node_exporter-1.3.1.linux-amd64.tar.gz
mv node_exporter-1.3.1.linux-amd64 /usr/local/node_exporter -
创建 Systemd 服务文件
cat > /etc/systemd/system/node_exporter.service <<'EOF'
[Unit]
Description=Node Exporter
Documentation=https://prometheus.io/docs/guides/node-exporter/
After=network.target
[Service]
User=root
Group=root
Type=simple
ExecStart=/usr/local/node_exporter/node_exporter --web.listen-address=:59100
Restart=always
RestartSec=3
SyslogIdentifier=node_exporter
[Install]
WantedBy=multi-user.target
EOF -
启动服务
systemctl daemon-reload
systemctl start node_exporter
systemctl enable node_exporter -
检查服务状态
systemctl status node_exporter -
在运维平台的
ops.yaml/ ConfigMap 中将新节点 IP 加入ENV_PROMETHEUS_HOST,多个节点用逗号分隔。示例:ENV_PROMETHEUS_HOST: "hap_1/192.168.1.12:59100,extra_node_01/192.168.1.20:59100"