Prometheus 简介

监控

监控用途

  • 告警(Alerting)

通常是重要监控对象出现异常,需要监控系统发布告警给系统管理员处理

  • 排查(Debugging)

系统管理员通过监控系统能够排查出导致异常的根本原因并且快速解决问题

  • 趋势(Trending)

告警和排查通常是针对已经发生的问题并且需要在短时间内解决(至少要止血)问题。然而,很多系统问题是存在趋势性的端倪的,通过监控系统可以发现趋势并采取有计划的应对措施

  • 探索(Plumbing)

虽然监控系统满足了上述三个目标以后,通常已经是一个比较好的监控系统。但是随着技术的不断发展,监控系统逐步演化成能够实现帮助我们分析整个业务和技术体系,指导我们改进系统。我觉得这块是未来的发展方向。

监控分类

大多数监控都是围绕 事件 展开的:事件几乎可以是任何事情,并且具有上下文。能够记录所有事件以及上下文可以有利于debug和从技术和商业逻辑上理解系统运行情况,可以通过4个方面来实现:

  • 剖析(Profiling)

剖析是在不能获取所有时间的所有事件的所有上下文情况下,通过截取一定事件范围内部分数据来实现的分析。例如,Tcpdump是一种常用的通过特定过滤方式记录网络流量的剖析工具。这是一个基本的debuging工具,但是你不可能在所有时间范围都启用tcpdump来抓取所有网络数据包进行分析,因为需要消耗大量都计算资源和存储资源。

备注

在Linux内核中,增强型Berkely包过滤器(enhanced Berkeley Packet Filters, eBPF)允许详细剖析从文件系统操作到网络异常的内核事件。强烈建议阅读 Linux Extended BPF (eBPF) Tracing Tools 来学习如何通过 eBPF 实现性能分析。

  • 跟踪(Tracing)

跟踪并不是查看所有事件,而是只关注部分事件,例如传递给特定功能的交互。通过跟踪,你可以了解程序耗费时间以及哪部分代码是延迟的主要原因。分布式跟踪通过唯一ID来跟踪远程调用RPC请求在集群中的处理过程,从而能够分析分布在集群不同主机上的不同进程完成分布式任务的执行情况。

举例,在分布式系统中,特别是现在的微服务体系架构,将原先有限的服务单元拆分成无数微小的进程部署在海量的服务器容器中,这对系统性能分析带来极大的挑战。和只是捕捉流量片段进行分析不同,跟踪系统可以跟踪和记录每个功能调用的耗时,从HTPP请求到后端数据库以及缓存,可以跟踪功能调用例如缓存命中以及缓存未命中的差异分析。

分布式跟踪系统在请求上附加唯一ID然后通过远程程序调用(RPCs)来传递给其他进程处理,通过这个唯一标识的ID汇总到一起跟踪不同进程和主机的处理情况。

备注

在分布式架构中,有一些重要的工具实现,例如 OpenZipkin分布式跟踪系统Jaeger分布式跟踪系统

尤其是 Jaeger分布式跟踪系统 已经成为 CNCF 孵化的和Kubernetes深度结合的分布式跟踪监控系统,对于分析Kubernetes集群的性能极为便利。

  • 日志(logging)

Prometheus概览

Prometheus(普罗米修斯)监控 是开源的系统监控和告警套装工具,最初由 SoundCloud 公司于2012年开发。Prometheus使用Go语言开发,并且采用Apache 2.0 license开源。Prometheus从2016年加入 Cloud Native Computing Foundation, CNCF ,成为Kubernetes之后第二个CNCF孵化项目。

Prometheus 提供了所有主流语言和运行环境的客户端库程序,包括 Go, Java/JVM, C#/.Net, Python, Ruby, Node.js, Haskell, Erlang 和 Rust。类似Kubernetes 和 Docker已经集成了Prometheus客户端库程序。对于第三方使用非Prometheus格式输出的软件,也有上百种集成方案。这种集成是通过 exporters 实现的,包括 HAProxy, MySQL, PostgreSQL, Redis, JMX, SNMP, Consul 和 Kafka等。

功能

Prometheus主要功能包括:

  • 一种具有 通过度量名称(metric name)和键值对来标识的时序数据 的多维度数据模型(data model)

  • PromQL,一种具有伸缩行的查询语言,可以衡量不同维度

  • 不依赖分布式存储; 单个服务器节点是自治的

  • 通过HTTP的拉取模式采集时序数据

  • 通过内建网管支持推送时序数据

  • 通过一系列发现或静态配置来获取目标

  • 多种图形和仪表盘支持的模式

组件

Prometheus 包含多个组件:

  • 主应用程序 Prometheus server 负责收集和存储时序数据

  • client libraries 客户端库程序负责集成到应用程序代码中

  • push gateway 推送网管支持短时间任务

  • 特定用途的 exporters 用于诸如 HAProxy, StatsD, Graphite 等第三方服务

  • alertmanager 告警管理器用于处理警报

  • 以及一系列工具

备注

通过 PromQL 可以定义告警,并且只要能数据图表化,就能够基于图表进行告警。

Prometheus性能极佳并且易于运行。一个单机运行的Prometheus能够每秒处理百万级别的样本数据。所有的Prometheus组件都能够容器化,这样就可以避免基于配置管理工具来维护。Prometheus自身也设计成集成到基础架构中,无需单独维护。

架构

../../../_images/prometheus_architecture.png

Prometheus 架构

Prometheus可以从编排任务中获取metrics,既支持直接获取也支持通过中间推送网管执行的短时间任务。所有抓取短样本都存储在本地并且基于这些数据运行归来在聚合或者从现有数据中记录下新的时序数据或生成告警。通常Prometheus会结合到 Grafana通用可视分析平台 或者其他API消费者平台来可视化采集的数据。

备注

传统的监控系统,例如 Nagios 是基于定时运行的检查脚本来检查服务异常返回值以确定是否告警;同时针对业务日志的监控和分析平台,例如Elasticsearh,Logstash和Kibana(ELK)提供了服务异常趋势分析。

但是在云计算和云原生环境中,单独的服务判断已经无法反映系统的健康程度,而是在大量的虚拟化和容器化环境中,复杂的相互调用监控才能掌控整个架构。需要同时结合服务告警和趋势分析的监控平台逐步成为这种应用场景的监控需求,Prometheus恰到好处地结合 Docker / Kubernetes 内嵌的 cAdvisor容器性能分析组件 ,实现了完整的监控体系。

使用场景

  • Prometheus适合做: - 非常适合记录任何纯数字时序数据:Prometheus 适合基于主机监控和高度动态面向服务的架构。在微服务架构中,Prometheus支持多维度数据采集以及提供强大的查询能力 - 适合快速诊断系统问题:Prometheus服务器是独立部署的,不依赖网络存储或其他远程服务。这样即使其他系统架构异常,也不会影响到监控平台

  • Prometheus不适合做: - 虽然Prometheus非常稳定,但是并不能保证数据百分百精确 - Prometheus不适合需要通过分析数据来记账的场景

备注

Prometheus主要提供近实时的、基于云和容器以及服务和应用服务器的内部监控,专注于当前发生事件,而不是跟踪历史数据。注意,Prometheus的使用假设是大多数监控查询和报警都是最近数据中生成的(通常一天以内)。

Prometheus的查询非常强大,但是监控数据保留期一般有限。

架构

  • Prometheus通过抓取应用程序中暴露的时间序列数据来实现监控。所谓时间序列数据通常是应用程序客户端库或者exporter(导出器)的代理作为HTTP端点暴露。

pull模式可以通过HTTP方式接收metrics,对于需要监控的系统,通过在 /metrics endpoint 输出metrics,这样Prometheus就能从这个endpoint拉取metrics。

  • 当前已经有很多exporter和客户端库,支持多种编程语言、框架和应用程序,例如Apache WEB服务器和MySQL数据库。

  • Prometheus还可以使用推送网关(push gateway)来接收少量无法拉取数据的监控目标发出的数据(例如防火墙后面的监控目标),此外也适合那种非常短暂存在的jobs和cronjobs。

  • PromQL 是一个非常具有伸缩性的查询语言,可以用来查询metrics

指标搜集

在Prometheus中,被采集的指标来源称为endpoint(端点),所谓端点通常对应是进程、主机、服务或应用程序。Prometheus定义目标(target) 配置:

  • 连接方式

  • 元数据

  • 身份验证

一组目标则被称为job,一般job是具有相同角色的目标组,例如Apache服务器集群,也就是一组相似的进程。

生成的时间序列数据被搜集并存储到Prometheus服务器本地或者外部存储器、第三方时间序列数据库。

服务发现

对于要监控的对象,可以:

  • 静态配置被监控资源列表

  • 基于文件:如使用配置管理工具定时自动生成Prometheus可以更新的资源列表

  • 自动发现

聚合&报警

通过查询出的数据再聚合,可以计算变化率、比率、求和等聚合,并且根据计算结果定义报警规则:

  • 异常的CPU使用率

  • 存储、网络使用率

Prometheus没有内置报警工具,而是将报警推送到 Alertmanager(报警管理器),由alertmanager管理、整合以及分发报警到不同目标。

PromQL

Prometheus内置了查询语句PromQL以及表达式浏览器和浏览服务器上数据的图形界面。

备注

为了性能和稳定性,建议在Prometheus服务器配置大容量内存和SSD磁盘。

冗余和高可用

Prometheus不是分布式系统,实际上还是单机运行。不过,通过部署多台服务器,可以提供冗余(每个服务器都是一样的数据)。部署冗余的Prometheus服务器可以在某个服务器故障时继续维持监控。注意,多个Prometheus会产生重复的报警,此时需要高可用Alertmanager消除重复报警。

可视化

通常Prometheus会结合开源监控仪表盘Grafana来提供可视化。

数据存储

Prometheus搜集时间序列数据,采用标签纬度为时间序列添加上下文。

标签会结合到时间序列进行存储,这样可以通过标签进行查询。时间序列由名称和标签标识。

由于Prometheus是为短期监控和报警需求设计的,所以默认情况下,只在数据库中保留15天时间序列数据。要保留更长时间数据,则建议将数据发送到第三方平台存储,例如,大数据存储,供后续进行消费分析。

安全性

Prometheus不提供任何服务器端身份验证、授权或加密。所以要加强安全,请使用反向代理访问Prometheus服务器,通过反向代理服务器上配置认证授权。

参考