from kafka import KafkaClient
from kafka.producer import SimpleProducerdef send_data_2_kafka(datas):
'''
向kafka解析队列发送数据
'''
client = KafkaClient(hosts=KAFKABROKER.split(","), timeout=30)
producer = SimpleProducer(client, async=False)
curcount = len(datas)/PARTNUM
for i in range(0, PARTNUM):
start = i*curcount
if i != PARTNUM - 1:
end = (i+1)*curcount
curdata = datas[start:end]
producer.send_messages(TOPICNAME, *curdata)
else:
curdata = datas[start:]
producer.send_messages(TOPICNAME, *curdata)
producer.stop()
client.close()
其中PARTNUM为topic的partition的数目,这样保证批量发送的数据均匀的落在kafka的partition中。
本文介绍了一种将数据均匀分配到Kafka topic分区的方法,通过使用Python的kafka库实现数据的批量发送,确保了数据能够均匀地分布于各个分区中。
223

被折叠的 条评论
为什么被折叠?



