
kafka
赫丙
走崎岖路,需平常心
展开
-
【kafka学习记录】3 - 生产者消息分区和压缩
在使用Apache Kafka生产和消费消息的时候,肯定是希望能够将数据均匀地分配到所有服务器上。比如很多公司使用Kafka收集应用服务器的日志数据,这种数据都是很多的,特别是对于那种大批量机器组成的集群环境,每分钟产生的日志量都能以GB数,因此如何将这么大的数据量均匀地分配到Kafka的各个Broker上,就成为一个非常重要的问题。 分区 消息组织方式:主题 -分区-消息 主题下...原创 2019-10-16 14:50:52 · 486 阅读 · 0 评论 -
【kafka学习记录】2 - kafka是什么
Apache Kafka是消息引擎系统,也是一个分布式流处理平台。 kafka产生原因: 之前有一些数据强实时处理方面的需求,但遇到了问题: 数据正确性不足。 因为数据的收集主要采用轮询(Polling)的方式,如何确定轮询的间隔时间就变成了一个高度经验化的事情。 系统高度定制化,维护成本高。各个业务子系统都需要对接数据收集模块,引入了大量的定制开销和人工成本。 ...原创 2019-10-16 14:41:16 · 186 阅读 · 0 评论 -
【kafka学习记录】1 - 为什么学习kafka
2019.10.04学习记录1 极客时间 - 《kafka核心技术与实战》 一、为什么学习kafka 就拿数据量激增来说,Kafka能够有效隔离上下游业务,将上游突增的流量缓存起来,以平滑的方式传导到下游子系统中,避免了流量的不规则冲击。 Apache Kafka是一款开源的消息引擎系统。 “消息传递” 官方:消息引擎系统是一组规范。企业利用这组规范在不同系统之...原创 2019-10-16 14:34:28 · 418 阅读 · 0 评论