
Kafka
文章平均质量分 86
五分钟学大数据
公众号:五分钟学大数据
展开
-
Kafka底层原理剖析(近万字建议收藏)
Kafka 简介Apache Kafka 是一个分布式发布-订阅消息系统。是大数据领域消息队列中唯一的王者。最初由 linkedin 公司使用 scala 语言开发,在2010年贡献给了Apache基金会并成为顶级开源项目。至今已有十余年,仍然是大数据领域不可或缺的并且是越来越重要的一个组件。Kafka 适合离线和在线消息,消息保留在磁盘上,并在集群内复制以防止数据丢失。kafka构建在zookeeper同步服务之上。它与 Flink 和 Spark 有非常好的集成,应用于实时流式数据分析。Kafka原创 2021-01-18 11:12:39 · 833 阅读 · 0 评论 -
大厂面试官竟然这么爱问Kafka,一连八个Kafka问题把我问蒙了?
本文首发于公众号:五分钟学大数据在面试的时候,发现很多面试官特别爱问Kafka相关的问题,这也不难理解,谁让Kafka是大数据领域中消息队列的唯一王者,单机十万级别的吞吐量,毫秒级别的延迟,这种天生的分布式消息队列,谁能不爱?在最近的一场面试中,有个面试官看到简历中的项目上写Kafka了,就直接开问Kafka,其他问题基本没问。下面来看下面试官的Kafka八连问:(以下答案是参考网上资料整理而成,实际面试时只回答了大约三分之一)1. 为什么要使用 kafka?缓冲和削峰:上游数据时有突发流量,原创 2021-01-14 15:42:28 · 769 阅读 · 0 评论