Trident与Kafka在互联网电台应用中的实践
1. Trident概述
Trident提供了一种抽象,让我们能以更接近纯粹的“做什么”(what)层面来表达计算,而减少“怎么做”(how)的细节。与原生Storm拓扑不同,Trident拓扑中的流是以元组批次的形式处理,而原生Storm拓扑则是逐个处理单个元组。
Trident有多种操作类型,这些操作可以帮助我们实现各种功能:
- Functions :对传入的元组进行操作,并发出一个或多个相应的元组。
- Filters :决定是否保留或过滤流中的传入元组。
- Splits :将一个流拆分为多个具有相同数据和字段的流。
- Merges :只有具有相同字段(相同的字段名和相同数量的字段)的流才能合并。
- Joins :用于合并大多数字段不同,但有一个或多个公共字段的不同流,类似于SQL连接。
- Grouping :在分区内按特定字段进行分组。
- Aggregation :对元组集合进行聚合计算。
- State updater :将元组或计算值持久化到数据存储中。
- State querying :查询数据存储。
- Repartitioning :通过对特定字
超级会员免费看
订阅专栏 解锁全文
1107

被折叠的 条评论
为什么被折叠?



