Storm又获东风,Hortonworks计划将其整合到Hadoop企业版

Hortonworks响应客户需求,计划将Storm流处理引擎整合进Hadoop产品中,此举旨在提升实时数据处理能力。预计将在年底完成初步整合,并在未来一年内加入更多企业级特性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

摘要:自YARN及Mesos等技术出现,Hadoop同集群上运行不同技术也成为了可能。然而,开源到商用之间存在的鸿沟不可谓不大。近日,基于广泛用户的需求,Hortonworks已决定将Storm整合到自己的Hadoop企业版中。

在YARN发布后,Hadoop拥有了同集群运行不同技术的可能,类似的技术还有加州大学伯克利分校建立的Mesos。然而将开源技术商用却并不是件简单的事情,据Gigaom的一则消息,Hortonworks正在致力Storm到Hadoop的商用整合。

以下为译文

在收到大量的客户请求后,Hortonworks决定开始 Sotrm流处理引擎整合到该公司的Hadoop产品中。考虑到Hadoop的批处理设计,这项工作确实有着重要的意义。

几年前,Backtype公司建立了流处理引擎Sotrm,期望弥补Hadoop一些流数据(比如传感器数据)的实时处理能力。 Twitter于2011年收购了Backtype,从此引领着Storm开发。然而当这个开源项目在网站开发上得到广泛认可时,一些革新陆续出现,其中就包括了 与Hadoop的整合或者 在Hadoop上运行

在Hortonworks客户发现Storm走进Twitter及Yahoo!这些知名企业后,他们也想使用这个技术来处理自己的流数据,从事geofencing、网页行为及从医用传感器的实时分析等业务。Hortonworks营销副总裁Dave McJannet说道:

我们看到许多早期用户对这个功能的渴望,同时也看到越来越多企业对实时处理的关心。

Hortonworks产品副总裁Bob Page说道:“ Storm在近日成为Apache软件基金会的孵化项目后,已然值得Hortonworks投资。”该公司之前聚焦的通常是 将Hadoop相关开源技术整合到旗下Hortonworks Data Platform产品,整合Storm这样的流处理框架完全是出于用户的需求。Hortonworks一直认为,在缺少强大的社区支持下,将一些远离Hadoop主干代码的技术整合到其产品将产生相当大的风险。

通过McJannet了解到,这个工作的主要挑战就在于如何整合成一个企业级产品,并且满足许多主流需求。

 

Page强调,Hortonworks的计划是在今年底完成基础等级整合,并在不久的将来为其注入企业级元素,大概会耗时1年左右的时间。他还补充说,并不会到所有特性完成后才会给用户发布。

在数据处理时间和方式上,Storm与Hadoop MapReduce基本上是两个对立面,而这两个技术具备整合可能性极大程度该归结于 YARN这个集群管理层。Hortonworks当下正在致力于通过新型处理框架Tez 来 提高Hive的速度,同时YARN还允许Hadoop用户 运行Spark内存处理框架。同时, 微软也在使用YARN让Hadoop更加适合机器学习用例

此外,通过YARN,同集群上同时运行HBase、 Giraph等不同技术也成为可能。此外,集群管理技术Mesos(加州大学伯克利分校出品,现已成为Apache项目) 同样支持了类似YARN功能,尽管其不是像YARN这样与HDFS捆绑。

更多技术的整合预示Hadoop这个大数据处理平台绝不是昙花一现,同时也会让Hadoop在大数据应用程序领域获得更高的统治力。

原文链接:Hortonworks has big plans to make Storm work for the enterprise (编译/仲浩 审校/周小璐)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值