Kafka从入门到放弃(四) —— Kafka在大数据领域的应用

大数据的奇妙冒险

已于 2022-01-27 10:37:03 修改

阅读量2.3k

点赞数 3

分类专栏：大数据 Kafka 文章标签： kafka big data 大数据分布式

于 2022-01-27 10:26:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_43596734/article/details/122713058

版权

Kafka作为一个消息中间件，其应用相当广泛，尤其在大数据领域，基本都会用到。由于笔者参与大数据工作，因此本文将从我的角度和经验出发，讲一下Kafka为什么广泛应用于大数据领域。对于Kafka不是很熟悉的朋友可以点击下方连接跳转进行阅读：

Kafka从入门到放弃(一) —— 初识Kafka
Kafka从入门到放弃(二) —— 生产者
 Kafka从入门到放弃(三) —— 消费者

背景&场景

在大数据场景下，数据经常需要经过ETL（抽取-转换-加载）的处理，从一端流向另一端（当然也有ELT，根据各个企业不同的考量决定不同的架构），比如从各个业务系统经过处理后落地到数据仓库，数据仓库有时候又要把数据提供给业务系统。

由于数据流向比较多，如果不做好数据链路规划，很容易造成开发重复、成本增加，出现问题也比较难以排查。因此，合理构造数据管道是很重要的，而Kafka在数据管道的构建中发挥了很大的优势。

特点&原因

批流一体

大数据处理分为流处理和批处理。流处理对实时性要求比较高，数据像水流一样源源不断的流动；批处理就是批量处理

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。