Prometheus+Grafana系统指标监控
⼀、常见监控指标
1.1 CPU
CPU使⽤率
dele
(1-avg(irate(node_cpu_conds_total{job="node_exporter",mode="idle"}[5m])) by (instance))*100
1分钟负载
node_load1{job="node_exporter"}
5分钟负载
node_load5{job="node_exporter"}
15分钟负载
node_load15{job="node_exporter"}
1.2 内存
如果要监控多个主机时,相应的instance就会有多个,job的名称也可能不同,这时要在grafana上设置变量,匹配到相应的数据,然后插⼊promql语句进⾏查询。下边这些变量可在grafan中设置,后⽂在进⾏说明。
总内存
node_memory_MemTotal_bytes{instance=~"$instance"}
已⽤内存
node_memory_MemTotal_bytes{instance=~"$instance"} - node_memory_MemAvailable_bytes{instance=~"$instance"}
可⽤内存
node_memory_MemAvailable_bytes{instance=~"$instance"}
内存Buffer
node_memory_Buffers_bytes{instance=~"$instance"}
内存cached
node_memory_Cached_bytes{instance=~"$instance"}
内存使⽤率
(1 - (node_memory_MemAvailable_bytes{instance=~"$instance"} / (node_memory_MemTotal_bytes{instance=~"$instance"})))* 100
英国奥运会吉祥物1.3 磁盘
恒星英语磁盘各分区磁盘空间
史蒂夫 欧文
node_filesystem_size_bytes{instance=~"$instance",fstype=~"ext.*|xfs"}
磁盘各分区使⽤空间
node_filesystem_size_bytes{fstype=~"ext.*|xfs",instance=~"$instance"}-node_filesystem_free_bytes{fstype=~"ext.*|xfs",instance=~"$instance"}
the door in the floor
磁盘各分区可⽤空间
node_filesystem_avail_bytes{fstype=~"ext.*|xfs",instance=~"$instance"}
磁盘各分区使⽤率
((node_filesystem_size_bytes{fstype=~"ext.*|xfs"}-node_filesystem_free_bytes{fstype=~"ext.*|xfs"})/node_filesystem_size_bytes{fstype=~"ext.*|xfs"})*100磁盘各分区读取速率
收费翻译irate(node_disk_read_bytes_total{instance=~"$instance"}[5m])*8spinster
磁盘各分区写⼊速率
irate(node_disk_written_bytes_total{instance=~"$instance"}[5m])*8effort是什么意思
1.4 ⽹络
接收数据包速率(下载)
irate(node_network_receive_bytes_total{job=~"$job"}[5m])
传输数据包速率(上传)
irate(node_network_transmit_bytes_total{job=~"$job"}[5m])
1.5 机器信息
运⾏时间
sum(time() - node_boot_time_conds{job=~"$job"})by(instance)
黄西在美国记者年会上的脱口秀机器系统版本信息
node_uname_info{instance="$instance"} -0
abnt-0意思是不显⽰__name__标签,即metric名称