背景:
influxdb数据旁路一份到prometheus后,prometheus的图有时延时很大,主要是在业务忙的时候,闲的时候是可以处理到数据的。而influxdb的数据是可以正常显示的。而且这时牛逼的google并帮不了忙,各种关键字去搜索都找不到相关的问题。
架构
调试过程
先去prometheus的web控制台看图。初看这个图感觉是没有问题的,数据是连续的。
仔细看,其实直线那段是没有数据有。用grafana配到同一个prometheus来看一下grafana的图长这样
在grafana是可以明显看到中间是丢了一段时间的。而且prometheus的图却是连续的。最开始我没有看出来。把生产环境的docker部到自己的电脑,看控制台是没有问题的。所以猜想是生产环境的数据量过大,prometheus没处理过来引起的。
上去生产环境抓包,
先找一下prometheus和influxdb_exporter的ip。
docker exec