1、功能说明
示例代码地址:https://blog.youkuaiyun.com/forgetthatnight/article/details/80865642
设计一个topology,来实现对文档里面的单词出现的频率进行统计。
整个topology分为三个部分:
l RandomSentenceSpout:数据源,在已知的英文句子中,随机发送一条句子出去。
l SplitSentenceBolt:负责将单行文本记录(句子)切分成单词
l WordCountBolt:负责对单词的频率进行累加
2、项目主要流程

3、RandomSentenceSpout的实现及生命周期

4、SplitSentenceBolt的实现及生命周期
5、WordCountBolt的实现及生命周期

本文介绍使用Apache Storm实现一个简单的实时单词频率统计系统。该系统包含三个组件:RandomSentenceSpout作为数据源,随机发送预定义的英文句子;SplitSentenceBolt用于将句子拆分为单词;WordCountBolt负责统计并更新单词频率。
210

被折叠的 条评论
为什么被折叠?



