Storm-入门

本文深入探讨了Storm实时处理框架,对比Hadoop和Spark Streaming,强调其在实时数据分析、在线机器学习等领域的应用优势。文章详细阐述了Storm的编程模型、扩展性、可靠性及容错性,并介绍了其在电商和电信行业的实际案例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Storm是什么

  1.  

Strom技术网站

  1. 官网;srorm.apache.org
  2. githup: guithup.com/apache/storm

Strom对比Hadoop

  1. 数据源/处理领域:Hadoop数据存储在HDFS
  2. 处理过程不同:
    1. hadoop:map+reduce
    2. Storm:spout+bolt
  3. 进程是否结束
    1. Hadoop:启动的时候申请资源,作业全部跑完之后资源才可以释放
    2. Strom:没有结束状态
  4. 处理速度
    1. Hadoop:
    2. Storm:HDFS上的TB级数据
  5. 使用场景
    1. Storm:
      1. realtimr analytics
      2. online machine learning
      3. 不间断计算
      4. 分布式RPC
      5. ETL and more
    2. Hadoop:

Strom对比SparkStreaming

标题

 

Sparkstreaming是建立在spark的基础上,集合多种场景计算。一站式解决各种场景问题。storm在各种场景之间进行切换的时候需要

 

Storm的实时性高,结果直接落地。不需要进行下一步计算

Storm优势

  1. 编程模型 spout+bolt
  2. 扩展性:分布式
  3. 可靠性:可以保证spout发出的数据仅仅可以处理一次。工作进程的可靠性。
  4. 容错性:
  5. 多语言:

Storm应用现状以及发展趋势

  1. 应用现状
    1. 雅虎,推特。。。。
  2. 发展趋势
    1. 免费开源分布式处理框架,依赖于社区的发展
    2. 企业的需求
    3. 大数据相关的大会,Storm主题的数量不断上升
    4. 互联网数据量增长庞大,阿里Jstorm

Storm应用案例

  1. Storm在电商行业的应用
    1. 一淘实时分析系统
    2. 携程网站性能监控
    3. 阿里妈妈用户画像:用户兴趣基于用户的额历史行为,用户的实时查询,用户的实时点击,用户的地理信息。其中实时查询,实时点击等用户行为都是实时数据。
  2. Storm在电信行业的应用
    1. 论文:
      1. 基于Storm的诈骗电话分析系统的设计与实现
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值