Storm
晚风中的自由
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Storm】Spout的storm-starter及Grouping策略、并发度讲解、网站浏览量和用户数统计
maven先安装好。以下讲storm-starter的使用。1、从github下载官方的storm-starter例子包,是maven工程, 地址https://github.com/nathanmarz/storm-starter2、把文件解压复制到workspace目录下,用cmd命令行,在该文件目录下运行mvn eclipse:eclipse,生成eclipse所...原创 2019-08-18 12:53:47 · 713 阅读 · 0 评论 -
【Storm】Storm集群和作业监控告警开发
监控方案storm的所有状态写在zookeeper中,而且nimbus和supervisor通信完全通过zookeeper;可以通过访问zookeeper得知集群状态,如nimbus、supervisor是否正常,线上作业是否状态良好?要求:1、可配置化;2、当numbus或supervisor停掉后,发告警出来;3、当监控的作业停掉后,告警出来;(1)配置文件s...原创 2019-09-22 16:51:55 · 529 阅读 · 0 评论 -
【Storm】Trident 综合实战
需求基于HBase开发state,作为外部存储;支持非事务,事务,不透明事务;目的:全面练习Trident开发;通过核心概念state自定义实现,可以深刻理解state各类语义的封装实现,从而深刻理解Trident处理流程。在官方案例storm-starter-master的工程上做修改,增加代码。首先在pom.xml文件中加入以下内容,再保存; <depen...原创 2019-09-22 16:39:32 · 300 阅读 · 0 评论 -
【Storm】Trident state 概念
核心概念Trident在读写有状态的数据源方面是有着一流的抽象封装;状态即可以保留在topology的内部,如内存(但易丢失,服务器重启后不可用),也可以放到外部存储当中,如HDFS,Memcached(内存级数据库)或no-sql数据库(如Hbase)。这些都是使用同一套Trident API。Trident以一种容错的方式来管理状态(状态指结果数据),以至于当你在更新状态的时候你不需要...原创 2019-09-20 23:01:24 · 327 阅读 · 0 评论 -
【Storm】Trident 各类操作的输出
1、函数package trident.function;import backtype.storm.tuple.Values;import storm.trident.operation.BaseFunction;import storm.trident.operation.TridentCollector;import storm.trident.tuple.TridentTu...原创 2019-09-18 00:41:14 · 298 阅读 · 0 评论 -
【Storm】ITridentSpout、FirstN(取Top N)实现、流合并和join
一、ITridentSpout基于事务static interfaceITridentSpout.BatchCoordinator<X>static interfaceITridentSpout.Emitter<X>接口类的实现和之前事务ITransactionalSpout非常类似(1)ITridentSpout<T> 接口类,有...原创 2019-09-15 23:41:51 · 263 阅读 · 0 评论 -
【Storm】Trident实战之计算网站PV
需求用Trident实现汇总型PV统计;1:按天2:累计FixedBatchSpout发送若干个tuple,每个tuple是一个字符串,字符串格式是hosts + "\t" +sessionId + "\t" +times,其中times是日期 + 时间。每个batch最多包含3个tuple,不设置为持续发送。DRPC 函数名称 getPV,execute第二个参数是日期. ...原创 2019-09-15 19:15:10 · 354 阅读 · 0 评论 -
【Storm】Trident API和概念(Operation类)
一、Trident SpoutITridentSpout:是最通用的spout,可以支持事务或者不透明事务定义;IBatchSpout:一个非事务spout;IPartitionedTridentSpout:分区事务spout,从数据源(kafka集群)读分区数据;IOpaquePartitionedTridentSpout:不透明分区事务spout,从数据源读分区数据;1、I...转载 2019-09-14 21:54:47 · 593 阅读 · 0 评论 -
【Storm】Storm Trident 入门和入门案例讲解
参考自这篇文章https://blog.youkuaiyun.com/derekjiang/article/details/9126185一、什么是 Storm Trident ? Trident是在storm基础上,一个以realtime 实时计算为目标的高度抽象。 它在提供处理大吞吐量数据能力的同时,也提供了低延时分布式查询和有状态流式处理的能力。 如果你对Pig和Cascadin...转载 2019-09-13 10:38:54 · 522 阅读 · 0 评论 -
【Storm】DRPC精解和案例分析
一、DRPC简介和工作流程1、DRPC 简介分布式RPC( distributed RPC,DRPC) 用于对storm上大量的函数调用进行并行计算。对于每一次函数调用,storm集群上运行的拓扑接收调用函数的参数信息作为输入流,并将计算结果作为输出流发射出去。一句话概括:storm进行计算,根据客户端提交的请求参数,而返回storm计算的结果。DRPC通过DRPC Server...原创 2019-09-01 11:00:02 · 856 阅读 · 0 评论 -
【Storm】Storm事务案例实战
一、Storm事务案例实战之 ITransactionalSpout案例背景:统计网站每天的访问量1、ITransactionalSpout,事务性的spout类,继承ITransactionalSpoutpackage transaction1;import java.util.HashMap;import java.util.Map;import java.util.Ra...原创 2019-08-31 10:59:47 · 689 阅读 · 0 评论 -
【Storm】Strom事务主要API及官方案例分析
1、事务主要API(1)Spout(a)ITransactionalSpout<T>,同BaseTransactionalSpout<T>,普通事务Spout(b)IPartitionedTransactionalSpout<T> ,接口,分区事务,增加消息队列吞吐量,现在的消息队列大多支持分区;同BasePartitionedTransactiona...原创 2019-08-11 19:01:07 · 470 阅读 · 0 评论 -
【Storm】批处理事务原理以及事务
1、批处理 对于容错机制,Storm通过一个系统级别的组件acker,结合xor校验机制判断一个tuple是否发送成功,进而spout可以重发该tuple,保证一个tuple在出错的情况下至少被重发一次。但是在需要精确统计tuple的数量如销售金额场景时,希望每个tuple”被且仅被处理一次” 。Storm 0.7.0引入了Transnational Topology, 它可以保证...原创 2019-08-10 21:47:01 · 758 阅读 · 0 评论 -
【Storm】集群统一启动和停止shell脚本开发
hadoop集群有统一启动的命令start-all.sh 启动全部进程stop-all.sh 停止全部进程hadoop如果用cdh版本 + Cloudera Manager界面化管理,直接在界面上点击按钮即可启动集群。而storm集群有多个进程在运行,只能运行以下命令逐一去停止kill -9 进程id这样子很不方便,可以采用shell脚本来启停所有storm...原创 2019-08-07 22:46:18 · 861 阅读 · 0 评论 -
【Storm】API入门案例开发
1.Component 组件注:上图中用红框圈出的是3个常用的API。1)基本接口 (1)IComponent 接口 (2)ISpout 接口 (3)IRichSpout 接口 (4)IStateSpout 接口 (5)IRichStateSpout 接口 (6)IBolt 接口 (7)IRichBolt 接口 (8)IBasicBolt...原创 2019-08-18 14:10:51 · 447 阅读 · 0 评论 -
【Storm项目实战】1、Storm项目实战课程大纲
流计算前景大数据实时计算为什么说是趋势?对数据要求越来越高,快速得到数据可以:电商营销调整决策; 告警系统; 推荐系统:实时推荐,精准化推荐;Storm流计算之项目实战篇(Storm+Kafka+HBase+Highcharts+JQuery,含3个完整实际项目)课程分类:大数据适合人群:初级课时数量:40课时更新程度:70%用到技术:stormKafka+HBa...转载 2019-09-22 18:31:06 · 343 阅读 · 0 评论
分享