目录
4.3. 异地数据同步技术(Geo-Replication)
一. 前言
Kafka 最初由 Linkedin 公司开发,是一个分布式、支持分区的(Partition)、多副本的(Replica),基于 Zookeeper 协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景,比如基于 Hadoop 的批处理系统、低延迟的实时系统、Storm/Spark 流式处理引擎,web/nginx 日志、访问日志,消息服务等等,用 scala 语言编写,Linkedin 于2010年贡献给了 Apache 基金会并成为顶级开源项目。
Kafka 实际上算作是分布式的流处理平台,具备消息中间件的功能,在大数据领域作为流计算的平台,也会做消息分发。
Kafka 具有高吞吐量、高横向扩容以及故障转移,支持幂等性、事务以及三种消息语义,并且具有消息持久化等特点。
二. 使用场景
下面是一些关于 Apache Kafka 非常流行的使用场景。这些领域的概述,可查看英文博客
Apache Kafka 是一个分布式流处理平台,提供高吞吐量的消息发布和订阅功能,支持主题和日志持久化、分布式和容错。Kafka 作为消息系统和存储系统,适用于消息中间件、行为追踪、运营指标、日志收集和流处理等多种场景。其核心概念包括生产者、消费者、主题、分区和副本,保证了消息顺序和容错性。
订阅专栏 解锁全文
1419

被折叠的 条评论
为什么被折叠?



