Prometheus监控¶
监控是自动化运维的重要组成,没有监控,对于海量服务器的集群运维,就如同盲人摸象。
- Prometheus 简介
- Prometheus快速起步
- CentOS 7环境Prometheus快速起步
- 在反向代理后面运行Prometheus
- Prometheus Exporters
- 在Kubernetes中安装运行Prometheus
- 在Kubernetes(ARM)中安装运行Prometheus
- 在Kubernetes集群配置Kube State Metrics
- 使用Helm 3在Kubernetes集群部署Prometheus和Grafana
- 更新Kubernetes集群的Prometheus配置
- Prometheus配置(文件)
- PromQL
- Prometheus 规则
- Prometheus服务发现
- 基于文件配置的Prometheus服务发现
kube-prometheus-stack
添加Prometheus scrape配置kube-prometheus-stack
抓取节点metrics- Prometheus Operator
- Prometheus访问监控对象metrics连接被拒绝
- Prometheus监控对象metrics显示"context deadline exceeded"
- Prometheus监控Kubelet, kube-controller-manager 和 kube-scheduler
- Prometheus
Info-level alert inhibition
- Prometheus "PrometheusRuleFailures" 告警
- 使用Prometheus
- 在Kubernetes集群(z-k8s)部署集成GPU监控的Prometheus和Grafana
- 在Kubernetes集群(y-k8s)部署集成GPU监控的Prometheus和Grafana
kube-prometheus-stack
持久化卷kube-prometheus-stack
Grafana持久化卷后问题排查kube-prometheus-stack
节点选择kube-prometheus-stack
tsdb数据保存时间kube-prometheus-stack
改为hostNetworkkube-prometheus-stack
监控etcdkube-prometheus-stack
使用HTTP方式获取etcd的metrics监控kube-prometheus-stack
扩展运行参数(extraArgs
)kube-prometheus-stack
监控CoreDNS- 使用Prometheus Operator监控etcd
kube-prometheus-stack
监控longhorn分布式存储- 阿里云Prometheus监控产品
- Prometheus数据备份和恢复
- Grafana数据备份和恢复
- Prometheus监控Calico网络CNI
- Prometheus弹性伸缩
- Prometheus Debug
推荐阅读:
Prometheus操作指南 这是阿里巴巴的yunlzheng撰写的Prometheus手册,非常完备,在github上有3k的star,特别是集成钉钉的webhook,可以解决国内用户的通知痛点
OReilly - Prometheus Up & Running 本章节将根据自己学习这本书的实践来撰写
中文书籍在亚马逊上有一个 深入浅出Prometheus:原理、应用、源码与拓展详解 不过我还没有读过