
实时大数据处理
文章平均质量分 85
Rocky-Yang
这个作者很懒,什么都没留下…
展开
-
Kafka 数据存储Topic和Partition
对于Kafka 数据的存储,我们最经常听到的两个概念就是Topic和Partition了,下面就简单介绍下他们在Kafka系统中的意思和作用。TopicTopic是Kafka中消息的逻辑分类,每个Topic可有多个PartitionPartitionPartition是Kafka中实际的数据存储单元,每个Partition可以看做一个可以被订阅和消费的消息队列。每个Topic的pa...原创 2020-01-18 23:30:31 · 1299 阅读 · 0 评论 -
Kafka 入门介绍
鉴于Kafka在如今大数据处理领域的重要地位,还是写一篇文章来简单介绍一下kafka吧。本文只谈基础概念,也算是个小界,大神请绕道。这篇文章主要涉及一下几个方面:什么时Kafka 熟悉Kafka的基本概念 创建一个单节点的集群Kafka是什么?简单来说,Kafka是一个高性能,可扩展和稳定的消息系统。这是一个开源的流数据处理平台。Apache Kafka最初由LinkedIn开发和维...原创 2020-01-18 18:13:47 · 341 阅读 · 0 评论 -
Uber实时大数据系统架构分析-Kafka-Samza-Siddhi
Uber是全球最大的打车软件公司,而且正在发展为最大的车辆共享软件公司。对于Uber这样的公司来说,对巨量的实时流数据的处理的能力是至关重要的,其实时流数据的处理能力,效率和质量直接关系到公司核心业务的服务质量和用户的满意度。不知道滴滴在技术上是不是可以和Uber一拼,这里没有可能有挑战的意味:)。这篇文章通过研究Uber程序员在Devoxx,WSO2Con,DataWorks Summit等会...原创 2020-01-17 01:22:31 · 1424 阅读 · 1 评论