
Storm
高达一号
这个作者很懒,什么都没留下…
展开
-
大数据_Storm_cluster模式下storm kill topology时做cleanup的解决方法
1.背景在bolt中,需要在topology被关闭前执行某个操作,而根据官方文档:The cleanup method is called when a Bolt is being shutdown and should cleanup any resources that were opened. There's no guarantee that this转载 2016-08-09 15:57:30 · 2506 阅读 · 0 评论 -
大数据_Storm_Storm的一些基本指令
1、提交Topologies命令格式:storm jar 【jar路径】 【拓扑包名.拓扑类名】【stormIP地址】【storm端口】【拓扑名称】【参数】eg:storm jar /home/storm/storm-starter.jar storm.starter.WordCountTopology wordcountTop;storm jar /home/storm/stor原创 2016-08-04 22:23:03 · 2835 阅读 · 0 评论 -
Storm_Storm worker 内存占用调优
Storm 正真工作的节点是 worker 节点,所以在做调优的时候我们一般会对 Storm worker 的内存占用进行调整.默认情况下,Storm启动worker进程时,JVM的最大内存是768M。但我在使用过程中,由于会在Bolt中加载大量数据,768M内存无法满足需求,会导致内存溢出程序崩溃。经过研究发现,可以通过在Strom的配置文件storm.yaml中设置wor原创 2016-12-19 21:10:54 · 5297 阅读 · 0 评论 -
Storm_关停supervisor 以及 worker 进程, 利用kill
今天博主遇到了一个问题:需要关闭supervisor 以及 worker 节点。storm 貌似没有提供 关闭 supervisor 节点的指令: 这里我利用 kill -9 去杀死进程:#把supervisor 相关的进程都杀掉kill -9 $(ps -ef|grep supervisor | awk '{print $2}')原创 2016-12-19 11:45:13 · 5848 阅读 · 0 评论 -
Storm_Storm solt资源不够,再次提交topo / storm 分发任务 浅谈
原文: http://www.tuicool.com/articles/7Fbe6nJStorm集群的资源是有限的,如果达到资源使用的临界点,会发生什么?之前参考了不少资料,但都没有解释这个问题,这段时间不少朋友都问道这个问题,下面通过例证说明该现象。首先将之前一些资料做一些罗列:资料1:任务分配时 有两种情况: (a)task数目比worker多转载 2016-12-21 16:56:58 · 2629 阅读 · 0 评论 -
Storm_Storm 动态调优,并发度调整
Storm 动态平衡:Storm 里面有个动态调优的功能,可以通过Storm rebalance 进行 worker, executor 等数目的调整。注意: 虽然此功能较好,但是可能会丢失数据。Storm rebalance Synatax (Storm rebalance 语法):命令介绍:通过 storm help rebalance 进行调整:原创 2016-12-13 11:19:14 · 3609 阅读 · 0 评论 -
Storm搭建_ip限制
今天博主搭建了一个Storm 集群。 我配置的Storm 基于 zookeeper:由于 Storm群 与 Zookeeper 群 不在同一个位置,群与群之间 有 墙, 这时候就需要将 Storm 的群开放给 Zookeeper 群主要涉及到了两个端口1.zookeeper 服务端口2. 在storm.yaml 中 编辑 nimbus.thrift.p原创 2016-12-02 18:08:35 · 759 阅读 · 0 评论 -
Storm_Storm报错 Received invalid messages for unknown tasks. Dropping...
2016-12-02 15:31:53 worker [WARN] Received invalid messages for unknown tasks. Dropping... 问题 修改host,即hostname 要和hostname -i 对应起来,不能出现127.0.0.1 ,修改方法如下: a、设置hostname: hostname pc-name原创 2016-12-02 15:42:51 · 1808 阅读 · 0 评论 -
大数据_Storm_Storm消息机制_消息的可靠性
这章讨论Storm's reliability capabilities, 如何保证从spout emit出来的所有tuple都被正确的执行(fully processed)? What does it mean for a message to be "fully processed"? 首先的问题是, 什么叫tuple或message被fully processed转载 2016-08-10 18:44:47 · 1578 阅读 · 0 评论 -
大数据_Storm_Storm集群的搭建
源网址http://blog.youkuaiyun.com/hguisu/article/details/9246859 storm有两种操作模式: 本地模式和远程模式。本地模式:你可以在你的本地机器上开发测试你的topology, 一切都在你的本地机器上模拟出来; 远端模式:你提交的topology会在一个集群的机器上执行。本文以Twitter Storm官方Wiki转载 2016-08-03 16:11:02 · 871 阅读 · 0 评论 -
大数据_Storm_教程一_通过Storm UI 查看_Storm集群的基本信息
Storm做集群化管理的时候,可以通过Storm UI 启动图形界面监控线程。启动UI命令: storm ui下面对于Storm UI 所展示的一些数据进行简单的讲解。Cluster Summary : 集群概要 集群概要下的一些指标:|-- Version 版本信息|-- Supervisor 子节点的数原创 2016-08-08 17:18:27 · 7478 阅读 · 0 评论 -
大数据_Storm_Storm的集群模式与本地模式 (基于Storm 1.0.1)
今天博主遇到了一个问题,就是将Storm 设置成本地模式后,将 Storm 的包打压成jar , 提交上去。 这时候通过 Storm ui 启动 监控界面。 但是没有查看到 Topology ,应该是本地模式的锅,我将模式切换成集群模式就能在监控界面上看到Topology了。下面对 集群模式 与 本地模式的 设置代码 进行下粘贴, 留作备忘项目代码地址: h原创 2016-08-04 22:11:41 · 5361 阅读 · 0 评论 -
大数据_Storm_allGrouping方式需要注意的几个点
最近碰到一个storm的坑, 两个bolt都需要从kafkaSpout中获取数据进行各自的业务处理, bolt1的处理是幂等的, bolt2的处理是非幂等的, 上线后发现非幂等的bolt处理总是会处理两次, 代码如下://创建拓扑作业 TopologyBuilder builder = new TopologyBuilder(); //1. 创建Spout转载 2016-08-09 14:21:55 · 2425 阅读 · 0 评论 -
大数据_Storm_Storm 维护的一些注意事项
特点一:Storm 可以自动进行故障转移:如果某个子节点的Supervisor 挂掉了。由于Supervisor (子节点)上面运行着Topology 与 worker.那么该Topology的worker 可以自动转移到其他节点上,不需要手动配置。特点二:Storm 的手动平衡 Topology 的负载:上接特点一:假设 Storm 发生故障的子节点恢复了可以通原创 2016-08-10 10:45:48 · 1388 阅读 · 0 评论 -
大数据_Storm_教程二_Storm的基本设置
Storm 可以在Topology 中使用 代码 对 Storm 进行配置。通过配置可以进行调控,达到优化的效果下面以Java代码进行举例,示范下可进行的配置1.设置一个 Topology 中用的 worker / slot 数量。 Tips: worker 对应的是slots, 即 worker 与 slot (槽,最终的端口)是一对一原创 2016-08-08 18:42:20 · 4042 阅读 · 0 评论 -
大数据_Storm_Spout 与 bolt 的生命周期
Spout方法调用顺势Tips:从前向后为调用的顺序declareOutputFields()(调用一次)open() (调用一次)activate() (调用一次)nextTuple() (循环调用 ) deactivate() (手动调用)Bolt方法调用顺序declareOutputFields原创 2016-08-10 10:16:25 · 2020 阅读 · 0 评论 -
大数据_Storm_Storm之--配置项详解
转载请注明出处:http://blog.youkuaiyun.com/l1028386804/article/details/51924272配置项配置说明storm.zookeeper.serversZooKeeper服务器列表storm.zookeeper.portZooKeeper连接端口转载 2016-08-11 14:25:43 · 5860 阅读 · 0 评论