
storm相关
萝卜地里的兔子
爱吃胡萝卜的兔子
展开
-
在storm中使用流
storm是一个强大的流式计算框架,单流的storm在使用中非常普遍,而同时storm也提供对多个流的支持;通过定义多个流,用户可以进一步的把数据发放到不同的流中进行处理。代码如下:一、 定义多个流的spoutpublic class MultiStreamRandomWordSpout extends BaseRichSpout { private static final lo原创 2017-02-24 15:25:18 · 3631 阅读 · 0 评论 -
在storm中使用定时保存
在storm中使用实时保存会对性能带来很大的考验,所以在很多场景中还是使用定时保存;而且storm自带了定时功能,使用方式如下:首先在topo中的config中定义一个通信时间,定义方式如下:conf.put(Config.TOPOLOGY_TICK_TUPLE_FREQ_SECS, 60);设置这个属性以后,就会每隔60秒发送一次心跳信息到所有的bolt中,也就是每隔原创 2017-03-14 10:14:20 · 4039 阅读 · 0 评论 -
Trident API 概览
Trident API 概览 在网上看到了很多有TRIDENT相关API的翻译,看来看去,总觉得没有说清楚很多东西,所以自己结合使用的经验翻译了一篇出来;翻译完以后,也发现在自己的翻译中也有很多地方是表达不清楚的··不过多少感觉有些个人的理解编织在里面了。大侠们勿喷哈!原文地址:http://storm.apache.org/releases/1.1.0/Trident-API-Ov翻译 2017-06-06 13:58:50 · 1273 阅读 · 0 评论 -
Trident State译文
Trident State 译文Trident针对状态化的数据源的读写进行了一流的分装。State可以包含在拓扑中-例如,保存在内存中,有HDFS提供备份-也可以保存在一个外部的数据库中,像Memcached和Cassandra。针对以上的所有情况,Trident的API都是一样的。 为了保证state在更新的过程中遇到重试或者失败处理时任然能够具有幂等性,storm采取了必要的容错。翻译 2017-06-14 16:03:56 · 468 阅读 · 0 评论 -
storm-hbase jar包中的bolt节点源码解析
一段时间内,大家都是自己在storm的节点中实现对hbase的操作,不管是普通的topo还是在trident中都是这样;不知道从那个版本起,在storm的压缩包中就多出了好几个jar包,把针对habse,mysql,mongodb等等的数据库的操作都写好了框架,不需要我们在去自己实现了;这里就先解析一下strom-habse这个jar包在普通的topo中是怎么实现的: packa原创 2017-08-10 11:47:28 · 2841 阅读 · 1 评论