Storm实时计算-新手学习（案例模仿）

最新推荐文章于 2023-07-03 03:33:41 发布

原创

最新推荐文章于 2023-07-03 03:33:41 发布 · 1k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#实时计算 #storm

本文介绍了如何使用Storm进行实时计算，通过模拟Word Count案例，展示了Storm的结构和主要组件。首先，创建一个本地模式的Storm程序，包括Spout产生句子，Bolt进行分词和词频统计。开发环境使用IntelliJ IDEA，通过Maven配置相关依赖，并导入Storm的JAR包。案例代码包括SentenceSpout和Bolt的实现，帮助初学者理解Storm的工作原理。

前言：

实时计算必将在越来越多的业务场景下得以应用，故而有意学习一番。主要参考《Storm分布式实时计算模式》一书第1章节《分布式单词记数》。

一、要做的事

像mapreduce程序练手时常常用会word count 来演示，这里也用这个需求来演示storm实时计算。即是说，有一个消息源会源源不断地产生一些句子，然后最终的输出结果是所有句子中每个单词的词频统计。

本文中，我们开发一个本地模式的storm程序，并在IDE中编译运行，以形成对storm结构、主要思想的领会。

二、storm程序的框架

这张图就是精髓了！我们的storm程序中，将会依次包含上述几种对象，spout是消息产生源头，会源源不断地发送消息给出bolt. 每个bolt对象可以定义若干计算逻辑，就相当于spark中的一种算子一样。在下面的案例程序中，每个对象都将对应有一个类文件。

要实现本文目标，我们的思路是：产生句子(由spout实现) -> 分词(由bolt实现) -> 词频统计(由bolt实现） -> 报告数据(由bolt实现)

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。