线上kafka 线程idle报警,线程idle趋势图
查看topic监控平台,发现__consumer_offsets topic的每秒写入高出其他topic很多倍,大概率是因为消费者提交频繁导致的了,但是这是全局的topic,无法看到每个消费者的提交频率,所以只能根据topic的流量走势来找出和该topic相匹配的,进而只观察相关topic的消费者
1、查看趋势相匹配的topic
按照流量由大到小筛查每个topic,发现两个topic的流量趋势和__consumer_offset一样
2、走查消费这两个topic的消费者关键配置,针对拉取和提交相关参数进行优化,优化原则:
消费者拉消息:fetch.min.bytes =10240000 fetch.max.wait.ms = 500 满足两者之一就可以拉消息
消费者提交offset: 自动提交 auto.commit.interval.ms>1000 手动提交 根据业务需求设置每次提交的条数,不能逐条commit
生产者峰值qps只有200左右,为什么commit会这么高?
消费者多,比如topic1对应8个消费者