Prometheus使用名为prometheus.yml的配置文件进行设置,通过在启动时指定相关的文件,对配置内容进行加载。

该配置文件分为四个模块:global(全局配置)、alerting(告警配置)、rule_files(规则配置)、scrape_configs(目标拉取配置),本文将分别对其进行讲解介绍。

# 一. global

用于定义prometheus的全局配置。

global:
scrape_interval:     15s
evaluation_interval: 15s
scrape_timeout: 10s 
1
2
3
4

scrape_interval :用来指定Prometheus从监控端抓取数据的时间间隔(默认为15s),如果在特定的job指定时间间隔指标,则该job的配置会覆盖全局设置。

evaluation_interval:用于指定检测告警规则的时间间隔,每15s重新检测告警规则,并对变更进行更新。

scrape_timeout:定义拉取实例指标的超时时间。

# 二. alerting

用于设置Prometheus与Alertmanager的通信,在Prometheus的整体架构中,Prometheus会根据配置的告警规则触发警报并发送到独立的Alertmanager组件,Alertmanager将对告警进行管理并发送给相关的用户。

alerting:
  alertmanagers:
  - scheme: http
    timeout: 10s
    static_configs:
    - targets:
        - localhost:9093
1
2
3
4
5
6
7
  • scheme:配置如何访问alertmanager,可使用http或https。
  • timeout:配置与alertmanager连接的超时时间。
  • static_configs:配置alertmanager的地址信息,关于Alertmanager的内容会在后续的文档中介绍。

# 三. rule_files

用于指定告警规则的文件路径,文件格式为yml。

rule_files:
  - "rule_cpu.yml"
  - "rule_memory.yml"
1
2
3

Prometheus的告警规则都是通过yml文件进行配置,对于用惯了zabbix完善图形界面的人来说,一开始可能不会太习惯。 但这也是Promthesu的特点之一,这种方式提供了开放性的定制化功能,可以根据自己需要进行各类规则的定制化配置。

# 四. scrape_configs

用于指定Prometheus抓取的目标信息。

scrape_configs:
  - job_name: 'prometheus'
    static_configs:
    - targets: ['localhost:9090']
1
2
3
4

Prometheus对于监控数据的抓取,通过配置job的方式进行操作。在job里面指定了一组目标抓取所必须的信息,例如目标地址、端口、标签和验证信息等。抓取的时间间隔使用上面global模块配置的时间,也可在该job中单独指定。 在实际环境中,通常会根据抓取目标的类型不同,如Mysql、mongodb、kafka等,分成多个job来进行。

默认配置只有一个监控目标,即prometheus server本身,端口为9090,如果不指定路径,默认会从/metrics路径抓取。

上次更新: 2022/9/23 13:38:29