流分组: spout和bolt通讯的方式成为流分组。
意义: 便于同性质的数据放在一起
流分组类型:如下三种常用
1 Shuffle Grouping: 随机分组,随机发送tuple保证每个bolt接收,
每个bolt内的executor内接受到的tuple数目相同,实现负载均衡
2 Fields Grouping: 按字段分组,eg:userid分组,具有相同userid的tuple分到相同的Bolt
3 All Grouping: 全局分组,
本文介绍了Storm中三种常用的流分组方式:随机分组(ShuffleGrouping)、按字段分组(FieldsGrouping)和全局分组(AllGrouping),并详细解释了每种分组的意义及应用场景。
流分组: spout和bolt通讯的方式成为流分组。
意义: 便于同性质的数据放在一起
流分组类型:如下三种常用
1 Shuffle Grouping: 随机分组,随机发送tuple保证每个bolt接收,
每个bolt内的executor内接受到的tuple数目相同,实现负载均衡
2 Fields Grouping: 按字段分组,eg:userid分组,具有相同userid的tuple分到相同的Bolt
3 All Grouping: 全局分组,
1581
677

被折叠的 条评论
为什么被折叠?