大数据对Hadoop来说为什么是丰收的一年

随着数据体积、速度和种类的增长,传统数据库工具已难以应对。文章介绍了Apache Hadoop作为一款免费且支持数据密集型分布应用的软件框架,在管理非结构化数据方面的优势,并列举了多个行业巨头采用Hadoop进行大数据存储管理和分析的具体案例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本篇文章版权由ECF和HP所有

这篇文章是由CIO杂志母公司IDG的总裁兼CEO Michael Friendenberg所著

从IBM到亚马逊都转向Hadoop来管理需要存储的数据激增的问题。我们的CEO Michael Friendenberg说围绕着Hadoop的嗡嗡声可不是开玩笑的。

CIO – 在今天的商业技术世界里是不可能有不触及到大数据的对话的。

 简单的说,这是关于数据集体积、速度和种类方面变得越来越庞大,以至于无法用传统的数据库工具来管理。2011年,我们的全球数据输出估计达到了1.8ZB(zettabytes,1ZB=1亿TB)。更惊人的是广泛的估计来看世界上90%的数据是在过去两年中创建的。

在数据爆炸式增长的背后,当然,这是非结构化数据的世界。在去年的HP探索大会上,Autonomy的CEO兼信息管理部副总裁Mike Lynch谈到了关于非结构化数据一族的巨幅增长。他说IT世界正在渐渐远离结构化的、机器友好的信息(指的是由行和列管理的数据),并且向着来自email和社交媒体等渠道的更加人性化的和非结构化的数据发展,这不仅仅是文字和数字,同时也包括视频、音频和图像。

鉴于大数据的上升,我肯定你已经听到了围绕在Apache Hadoop身边的声音,这是一个可以免费使用的支持数据密集型分布应用的软件框架。它可以让应用系统与数千节点和PB级(1000TB)的数据一起工作。它肯定看起来像管理非结构化数据的圣杯,难怪大家都跳到了这个行列中。一个快速的网络调研显示就在过去的几个月里,一些公司像EMC、微软、IBM、Oracle、Informatica、HP、Dell和Cloudera已经开始采用这个软件框架。

我发现更加值得注意的是一些公司像雅虎、亚马逊、comScore和AOL已经开始用Hadoop来衡量他们的业务和降低存储成本。

根据最近的一些来自Infineta系统的调研,对一个广域网路优化启动来说,传统的数据存储每GB花费5美金,但是使用Hadoop存储同样的数据每GB只需要花费大概25美分。

这是一个让任何CIO都会记住的数字。

所以请在2012年准备好使用Hadoopalooza吧。我非常乐意听听你为处理大数据存储做了些什么,欢迎在任何时间给我写信。

Michael Friedenberg 是CIO杂志母公司IDG的总裁兼CEO。他的email是mfriedenberg@cio.com.

本篇文章版权由ECF和HP所有

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值