技术交流QQ群【JAVA,C++,Python,.NET,BigData,AI】:170933152
我们接下来要实现集群的监控,那么我们要监控什么?
比如节点资源利用率,有多少节点在用,多少节点在空闲
我们有多少节点,多少节点在运行pod
然后对于pod我们,比如要监控容器的指标,比如cpu的使用率等等,
应用程序的健康状态等.
我们要用这个普罗米修斯和这个grafana来进行监控
这prometheus支持,监控,报警,时间序列,以及可以做为一个数据库来使用,另外,这个是个开源的
他可以抓取一些数据,他是利用http协议进行数据的获取和保存,他也支持数据库.
他只需要使用http接口,接入就可以监控我们的集群了.