
Storm
沧南
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Storm Metric
storm从0.9.0开始,增加了指标统计框架,用来收集应用程序的特定指标,并将其输出到外部系统。 本文中采用的监听类是LoggingMetricsConsumer,统计指标值将输出到metric.log日志文件中。 当然也可以自定义监听类,只需要实现IMetricsConsumer接口即可,这些类可以在代码里注册(registerMetricsConsumer),也可以在 storm.yam原创 2014-04-02 14:44:50 · 7919 阅读 · 3 评论 -
flume+kafka+storm
配置flume: http://blog.youkuaiyun.com/desilting/article/details/22811593 配置kafka: http://blog.youkuaiyun.com/desilting/article/details/22872839 启动zookeeper、kafka及storm 创建topic: bin/kafka-topics.s原创 2014-04-08 17:34:06 · 6558 阅读 · 1 评论 -
storm集群任务迁移问题平滑迁移
最近想把老storm集群上的部分任务,迁移到新搭建的storm集群上。 BrokerHosts hosts = new ZkHosts(Constants.ZOOKEEPER_HOSTS); 虽然都是从一个kafka集群取数,但新老storm集群对应的ZK地址不一样,迁移过去后消息消费没有续上。 老storm集群上运行的任务,在zk集群上的topic消费偏移量一直原创 2017-01-11 11:21:42 · 1644 阅读 · 0 评论 -
Storm任务启动过慢
最近Storm集群提交任务后,任务的worker需要很长时间才能运行成功,从UI界面可以看到,个别worker一直在尝试不同机器的solt来启动,日志报错如下:2017-03-01T18:47:51.785+0800 o.a.s.z.ClientCnxn [INFO] Session establishment complete on server 10.1.3.41/10.1.3.41:2181,原创 2017-03-01 19:35:17 · 2436 阅读 · 2 评论 -
Kafka实时流数据经Storm至Hdfs
目前HDFS上日志一部分由MR清洗生成&二次计算,一部分直接从服务器离线上传,但在私有云环境下,离线日志的压缩上传可能会对服务造成性能影响,而且在很多日志已经实时传输到Kafka集群的情况下,考虑Kafka->Hdfs也不失为一条合理的路径。1. Kafka-Flume-Hdfs这种方法直接通过Flume-ng的Hdfs-Sink往Hdfs导数据,Hdfs-Sink用来将数据写入Hadoop分布式文原创 2017-03-14 18:34:16 · 6978 阅读 · 1 评论