版本注解:
canal:1.1.4
kafka:2.1.0
也许当你发现使用canal获取binlog数据后,也正常的推送到kafka中去。由于数据量较大,对kafka的topic进行了多分区设置。但是当你查询该topic数据时,发信数据都在其中一个分区内(0分区)。这个问题该怎么解决呢?!
当我遇到这个问题时,第一个想到的是不是kafka配置topic的设置问题。后来排查发现不是,那么就只能是canal的配置问题了。
因此,我又一次把instance.properties和canal.properties这两个配置文件从头到尾重新认真看了一遍。发现了几个和kafka partition相关的配置(instance.properties):
canal.mq.partition=0
# hash partition config
#canal.mq.partitionsNum=3
#canal.mq.partitionHash=test.table:id^name,.*\\..*
接下来,做了一个尝试:
canal.mq.partition=2
# hash partition config
#canal.mq.partitionsNum=3
#canal.mq.partitionHash=test.table:id^name,.*\\..*
修改后发现数据都分发到topic的2号分区中,因此不是修改这个配置。该配置是默认配置,不需要更改。
后来,我又做了一个测试: