Kafka 详解（二）

最新推荐文章于 2025-07-15 21:01:06 发布

mylife512

最新推荐文章于 2025-07-15 21:01:06 发布

阅读量184

点赞数

CC 4.0 BY-SA版权

分类专栏：大数据文章标签： kafka java 分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/sysocc/article/details/124889985

大数据专栏收录该内容

80 篇文章

订阅专栏

3.API操作

3.1.API位置

3.2.手动管理offset

通过consumer.commitSync();方法。

4.kafka分区策略

4.1.四种分区策略

①指定分区

②根据key的hash值

③没有指定分区和key，则轮询。

④自定义分区

4.2.自定义分区

5.kafka与flume整合

https://flume.apache.org/FlumeUserGuide.html#kafka-sink

6.kafka如何保证数据不丢失

6.1.生产者producer

6.1.1同步模式

producer.type=sync request.required.acks=1 # 设置发送数据是否需要服务端的反馈,有三个值0,1,-1 # 0: producer不会等待broker发送ack # 1: 当leader接收到消息之后发送ack # -1: 当所有的follower都同步消息成功后发送ack.

6.1.2.异步模式

producer.type=async
request.required.acks=1
queue.buffering.max.ms=5000
queue.buffering.max.messages=10000
queue.enqueue.timeout.ms=-1
batch.num.messages=200

通过buffer来进行控制数据的发送，分别是时间阈值与消息的数量阈值，如果buffer满了数据还没有发送出去，如果设置的是立即清理模式，风险很大，一定要设置为阻塞模式。

结论：producer有丢数据的可能，但是可以通过配置保证消息的不丢失。

6.2. 消费者consumer

通过offset来记录每次消费到了哪一条数据，

低速的消费模式：offset记录在了本地磁盘文件

高速的消费模式：zookeeper的节点上

6.3.服务器broker：

数据分区，备份保证数据的不丢失。

博客等级

码龄9年

113
原创

29
点赞

202
收藏

1465
粉丝

关注

私信

热门文章

分类专栏

大数据 80篇
flink 2篇
人工智能 4篇
matlab 1篇
java 18篇
Linux 8篇
python 1篇

展开全部收起

上一篇：: matlab 蒙特卡洛二重积分

下一篇：: Kafka 详解（一）

最新评论

使用 Apache Flink 开发实时 ETL
小胖java: 可以抽取本地文件吗？
Spark/Flink广播实现作业配置动态更新
优快云-Ada助手: 一定要坚持创作更多高质量博客哦, 小小红包, 以资鼓励, 更多创作活动请看: 新星计划2023: https://marketing.youkuaiyun.com/p/1738cda78d47b2ebb920916aab7c3584?utm_source=csdn_ai_ada_redpacket 新星计划2023: https://marketing.youkuaiyun.com/p/1738cda78d47b2ebb920916aab7c3584?utm_source=csdn_ai_ada_redpacket 上传ChatGPT/计算机论文等资源，瓜分￥5000元现金: https://blog.youkuaiyun.com/VIP_Assistant/article/details/130196121?utm_source=csdn_ai_ada_redpacket 新人首创任务挑战赛: https://marketing.youkuaiyun.com/p/90a06697f3eae83aabea1e150f5be8a5?utm_source=csdn_ai_ada_redpacket Microsoft Edge功能测评！: https://activity.youkuaiyun.com/creatActivity?id=10403?utm_source=csdn_ai_ada_redpacket 职场解惑讨论会: https://activity.youkuaiyun.com/creatActivity?id=10427?utm_source=csdn_ai_ada_redpacket 可持续能源技术真的能改变世界吗？: https://activity.youkuaiyun.com/creatActivity?id=10425?utm_source=csdn_ai_ada_redpacket 无效数据，你会怎么处理？: https://activity.youkuaiyun.com/creatActivity?id=10423?utm_source=csdn_ai_ada_redpacket 物联网技术正在如何影响我们的生活: https://activity.youkuaiyun.com/creatActivity?id=10421?utm_source=csdn_ai_ada_redpacket 生物识别技术能否成为应对安全挑战的绝佳选择？: https://activity.youkuaiyun.com/creatActivity?id=10411?utm_source=csdn_ai_ada_redpacket 应届生如何提高职场竞争力: https://activity.youkuaiyun.com/creatActivity?id=10409?utm_source=csdn_ai_ada_redpacket 讯飞星火大模型将超越chatgpt？: https://activity.youkuaiyun.com/creatActivity?id=10407?utm_source=csdn_ai_ada_redpacket 职场新人备忘录: https://activity.youkuaiyun.com/creatActivity?id=10405?utm_source=csdn_ai_ada_redpacket VR vs AR：哪种技术更有潜力改变未来？: https://activity.youkuaiyun.com/creatActivity?id=10399?utm_source=csdn_ai_ada_redpacket “裸奔”时代下该如何保护网络隐私: https://activity.youkuaiyun.com/creatActivity?id=10401?utm_source=csdn_ai_ada_redpacket 蓝桥杯备赛指南分享: https://activity.youkuaiyun.com/creatActivity?id=10317?utm_source=csdn_ai_ada_redpacket
大数据技术架构(组件)——Hive：环境准备2
行业报告: 头发少点好，透气，不然闷得慌
大数据技术架构(组件)——Hive：环境准备2
mylife512: 中间有点稀了
大数据技术架构(组件)——Hive：环境准备2
什么都干的派森: 你头发还有多少

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

mylife512 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。