按照文档原文大概取了一部分摘要
Kafka是什么
Kafka是分布式,基于分区,可复制的Commit Log服务,功能类似Messaging系统(MQ),但是它的设计是独特的
它的特点是,轻量级,高性能(按照 这篇blog里做的Benchmark , 3台便宜的机器组成的集群,写入速度可以到200万 / sec)
Kafka几个核心概念,后面再逐步挖掘每个概念
1)Topic2)Log
3)Distribution
4)Producer
5)Consumer
Kafka主要应用场景:
1) Messaging
类似ActiveMQ和RabbitMQ
2) Website Activity Tracking
这个应该是最初Kafka设计用来做的事情,比如跟踪用户点击,搜索等行为数据的搜集。
3) Metrics
Operational monitoring data, 用来可以做分布式环境的统计等
4) Log Aggregation
分布式环境下Log文件的统一管理
5) Stream processing
类似pipeline模式
6) Event Sourcing
Martin Fowler的EAP
http://martinfowler.com/eaaDev/EventSourcing.html
7) Commit Log
Kafka是一款轻量级、高性能的分布式消息系统,具备独特的设计特点,适用于多种应用场景,如消息传递、网站活动跟踪、监控、日志聚合、流处理和事件溯源等。
793

被折叠的 条评论
为什么被折叠?



