目录
一、解决思路
读取行==》切分行==》统计单词==》输出结果
1、LineSpout
读取外部数据、转换成为tuple、发送数据流
2、SplitLineBolt
获取tuple中的行
按照空格切分出单词
将单词转换成tuple
发送数据流
3、WordCountBolt
累计统计单词出现的次数
每当发现单词的数量发生变化时
将单词和最新的数量转换成tuple
发送数据流
4、ReportBolt
将最新的单词计数进行打印
本文介绍了如何使用Apache Storm进行实时单词计数,详细讲解了从创建Java项目到编写LineSpout、SplitLineBolt、WordCountBolt、ReportBolt以及WordCountTopology的全过程,并在项目根目录下提供test.txt文件进行测试运行。
订阅专栏 解锁全文
1096

被折叠的 条评论
为什么被折叠?



