原文 http://www.iteye.com/news/25341
全球虚拟化和云基础架构领导厂商VMware公司今天公布了最新开源项目——Serengeti,支持企业能够在虚拟和云环境中快速部署、管理和扩展Apache Hadoop。此外,VMware与Apache Hadoop社区共同合作研发扩展功能,让主要组件可以“感知虚拟化”以支持灵活扩展,并进一步提高Hadoop在虚拟化环境中的性能。

VMware公司云应用服务副总裁陈志璋表示:
Apache Hadoop事实上正在成为大数据处理的标准,但部署和运营的复杂性、特定的硬件需求、安全上的顾虑和服务水平保障让很多企业无法充分发挥Hadoop的威力。通过把Apache Hadoop节点从底层物理基础架构剥离,VMware可以将云基础架构的优势带给Hadoop,包括快速部署、高可用性、最佳资源利用率、灵活和安全多租户。
Serengeti基于Apache 2.0许可证。它是一键式部署工具包,支持企业能够利用VMware vSphere平台在几分钟内部署高度可用的Apache Hadoop集群,包括Apache Pig和Apache Hive等常见的Hadoop组件。通过使用Serengeti在VMware vSphere上运行Hadoop,企业可以轻松享受到值得信赖、广泛部署的全球虚拟化平台的高可用性、容错性和现场迁移能力,从而实现Hadoop集群的可用性和可管理性。
OVUM首席分析师Tony Baer表示:
VMware与Cloudera、Greenplum、Hortonworks、IBM和MapR等领先的Apache Hadoop分销商合作,从而进行广泛分销。
虚拟化扩展、Spring更新帮助企业构建和运营大数据应用
为了简化并加速企业使用Apache Hadoop,VMware与Apache Hadoop社区合作更新Hadoop分布式文件系统(HDFS)和Hadoop MapReduce项目,使其能够感知虚拟化,从而支持数据和计算工作在虚拟基础架构中可以进行最佳分布。这些改变支持企业能够实现更灵活、更安全且高度可用的Hadoop集群。
VMware还发布了Spring for Apache Hadoop(2012年2月首次发布的开源项目)的更新,让企业开发者能够轻松利用Apache Hadoop开发分布式处理解决方案。上述更新支持Spring开发者能够轻松开发可以与HBase数据库、Cascading库和Hadoop相集成的企业应用。Spring for Apache Hadoop可以免费下载,目前可以通过开源Apache 2.0许可证获取。
上述项目和新功能旨在加速Hadoop使用,并支持企业充分利用Cetas等大数据分析应用从海量数据中获得实时的智能洞察力。VMware在2012年4月收购了Cetas,Cetas分析服务目前可以在www.cetas.net网站获得。