Prometheus简介
#Prometheus
简介
Prometheus 是云原生计算基金会的一个项目,是一个系统和服务监控系统。它以给定的时间间隔从配置的目标收集指标,评估规则表达式,显示结果,并在观察到指定条件时触发警报。
监控的目的
监控系统分为黑盒监控和白盒监控:
- 白盒监控能够了解系统内部的实际运行状态,通过对监控指标的观察能够预判可能出现的问题,从而对潜在的不确定因素进行优化。
- 黑盒监控,常见的如HTTP探针,TCP探针等,可以在系统或者服务在发生故障时能够快速通知相关的人员进行处理。
监控的目的:
- 长期趋势分析:通过对监控样本数据的持续收集和统计,对监控指标进行长期趋势分析。例如,通过对磁盘空间增长率的判断,我们可以提前预测在未来什么时间节点上需要对资源进行扩容。
- 对照分析:两个版本的系统运行资源使用情况的差异如何?在不同容量情况下系统的并发和负载变化如何?通过监控能够方便的对系统进行跟踪和比较。
- 告警:当系统出现或者即将出现故障时,监控系统需要迅速反应并通知管理员,从而能够对问题进行快速的处理或者提前预防问题的发生,避免出现对业务的影响。
- 故障分析与定位:当问题发生后,需要对问题进行调查和处理。通过对不同监控监控以及历史数据的分析,能够找到并解决根源问题。
- 数据可视化:通过可视化仪表盘能够直接获取系统的运行状态、资源使用情况、以及服务运行状态等直观的信息。
数据模型
Prometheus采集的监控数据均以指标(metric)的形式保存在内置的时间序列数据库当中(TSDB)。所有的样本除了基本的指标名称以外,还包含一组用于描述该样本特征的标签,基于这些标签可以方便地对监控数据进行聚合,过滤,裁剪。
SHELL
http_request_status{code='200',content_path='/api/path', environment='produment'} => [value1@timestamp1,value2@timestamp2...]
http_request_status{code='200',content_path='/api/path2', environment='produment'} => [value1@timestamp1,value2@timestamp2...] 查询语言PromQL
Prometheus内置数据查询语言PromQL。 通过PromQL可以实现对监控数据的查询、聚合。同时PromQL也被应用于数据可视化(如Grafana)以及告警当中。
PromQL可以实现包括以下功能:
- 指标的分布范围
- 预测一段时间之后的指标值
- 过滤 TopN 的指标
- ……
Prometheus架构

- Prometheus Server是Prometheus组件中的核心部分,负责实现对监控数据的获取,存储以及查询。
- Exporter将监控数据采集的端点通过HTTP服务的形式暴露给Prometheus Server,一般来说可以将Exporter分为2类:
- 直接采集:直接内置了对Prometheus监控的支持
- 间接采集:通过Prometheus提供的Client Library编写该监控目标的监控采集程序
- 在Prometheus Server中支持基于PromQL创建告警规则,如果满足PromQL定义的规则,则会产生一条告警,而告警的后续处理流程则由AlertManager进行管理。
- PushGateway 用于无法拉取指标的临时任务,相当于指标缓存器