Prometheus 搭建 Prometheus-Node-Exporter 入门实战

在当今数字化时代,监控和运维是保证系统稳定运行的关键。Prometheus 是一个开源的监控和警报工具,而 Prometheus-Node-Exporter 是一个用于收集主机系统信息的工具。本文将带您走进 Prometheus-Node-Exporter 的搭建实战,帮助您快速入门。

一、Prometheus 简介

Prometheus 是一个开源的项目,由 SoundCloud 开发,用于监控和警报。它具有以下特点:

  • 数据存储:Prometheus 使用时间序列数据库存储监控数据。
  • 数据采集:通过 Prometheus 拉取或推送的方式获取数据。
  • 可视化:Prometheus 提供了强大的可视化工具,如 Grafana。
  • 警报:Prometheus 支持灵活的警报规则,可自定义发送警报的方式。

二、Prometheus-Node-Exporter 简介

Prometheus-Node-Exporter 是一个用于收集主机系统信息的工具,它可以收集 CPU、内存、磁盘、网络等指标。通过 Prometheus-Node-Exporter,我们可以更全面地了解主机系统的运行状况。

三、Prometheus-Node-Exporter 搭建步骤

以下是在 Linux 系统上搭建 Prometheus-Node-Exporter 的步骤:

  1. 安装 Prometheus-Node-Exporter

    # 安装 Prometheus-Node-Exporter
    curl https://github.com/prometheus/node-exporter/releases/download/v1.3.1/node-exporter-1.3.1.linux-amd64.tar.gz -o node-exporter.tar.gz
    tar -zxvf node-exporter.tar.gz
    cd node-exporter-1.3.1.linux-amd64
  2. 启动 Prometheus-Node-Exporter

    # 启动 Prometheus-Node-Exporter
    ./node-exporter
  3. 配置 Prometheus 采集 Prometheus-Node-Exporter 数据

    打开 Prometheus 的配置文件(通常位于 /etc/prometheus/prometheus.yml),添加以下内容:

    scrape_configs:
    - job_name: 'node'
    static_configs:
    - targets: ['localhost:9100']

    保存并退出配置文件。

  4. 重启 Prometheus

    systemctl restart prometheus
  5. 验证 Prometheus-Node-Exporter 是否正常工作

    打开浏览器,访问 Prometheus 的 Web 界面(默认地址为 http://localhost:9090),在左侧菜单中选择 “Status”,然后点击 “Targets”。您应该能看到 Prometheus-Node-Exporter 的状态为 “UP”。

四、案例分析

假设我们想监控一个 Linux 服务器上的 CPU 使用率,我们可以通过以下步骤实现:

  1. 修改 Prometheus-Node-Exporter 配置文件

    在 Prometheus-Node-Exporter 的配置文件中添加以下内容:

    scrape_configs:
    - job_name: 'node'
    static_configs:
    - targets: ['localhost:9100']
    metrics_path: '/metrics'
    params:
    job: 'node'

    保存并退出配置文件。

  2. 重启 Prometheus-Node-Exporter

    ./node-exporter --config.file=/etc/node-exporter/prometheus.yml
  3. 在 Prometheus 中添加指标

    打开 Prometheus 的配置文件,添加以下内容:

    - job_name: 'node'
    static_configs:
    - targets: ['localhost:9100']
    metrics_path: '/metrics'
    params:
    job: 'node'

    保存并退出配置文件。

  4. 重启 Prometheus

    systemctl restart prometheus
  5. 验证 CPU 使用率

    打开浏览器,访问 Prometheus 的 Web 界面,在左侧菜单中选择 “Metrics”,然后在搜索框中输入 node_cpu_usage_seconds_total,即可查看 CPU 使用率。

通过以上步骤,我们成功地在 Prometheus 中监控了 Linux 服务器的 CPU 使用率。类似地,您还可以监控内存、磁盘、网络等指标。

猜你喜欢:全栈链路追踪