Confluo —— 多数据流实时数据分析系统

最新推荐文章于 2025-12-02 09:40:37 发布

原创

最新推荐文章于 2025-12-02 09:40:37 发布 · 896 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#kafka #Confluo #实时数据分析

Confluo是一个由伯克利大学riselab开源的多数据流实时数据分析系统，声称其吞吐量比Kafka高4到10倍。Confluo的设计目标是同时实现高吞吐量数据提取和复杂查询，采用C++实现，支持Python和Java的Client API。与Kafka相比，Confluo通过无锁的RingBuffer和原创报文头数据索引提高并发效率，解决了快照问题。

18年的12月5号，伯克利大学的riselab开源了Confluo。作为一个多数据流实时数据分析系统，按照论文的说法，吞吐量将会比 Kafka 高 4 到 10 倍。

原文：《Confluo: Millisecond-level Queries on Large-scale Live Data》

地址：https://rise.cs.berkeley.edu/blog/confluo-millisecond-level-queries-on-large-scale-streaming-data/

github地址：https://ucbrise.github.io/confluo/

Confluo是一个开源的C++项目，目前Confluo Client API支持的语言还包含：Python，Java，包括：1）Confluo的数据结构库，支持高吞吐量日志，以及各种在线（实时聚合，条件触发器执行等）和离线（ad-hoc过滤器，聚合等）查询； 2）Confluo服务器实现，它封装数据结构并通过RPC接口公开其操作，以及C ++，Java和Python中的客户端库。

场景评估：

一个网络监控和诊断框架，Confluo能够在单个核心上以线速（对于10Gbps链路）执行数千个触发器和数十个过滤器。
这是一个时间序列数据库，与先进技术相比，Confluo的吞吐量提高了2-20倍，插入延迟降低了2-10倍，吞吐量提高了1.5倍-5倍，时间范围查询延迟降低了5-20倍时间序列数据库：CorfuDB，TimescaleDB和BTrDB。
一个pub-sub系统，Confluo在发布 - 订阅吞吐量

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。