一.介绍(请详见百度百科等链接)
1.Hadoop介绍
Hadoop原本来自于谷歌一款名为MapReduce的编程模型包。谷歌的MapReduce框架可以把一个应用程序分解为许多并行计算指令,跨大量的计算节点运行非常巨大的数据集。Hadoop这个名字不是一个缩写,而是一个虚构的名字。该项目的创建者,Doug Cutting解释Hadoop的得名 :“这个名字是我孩子给一个棕黄色的大象玩具命名的。我的命名标准就是简短,容易发音和拼写,没有太多的意义,并且不会被用于别处。小孩子恰恰是这方面的高手。”
Hadoop目前隶属于Apache基金会,是当今最为完善的开源大数据解决方案。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。
百度百科:
http://baike.baidu.com/link?url=pIJEM8x2axShnDoH9EK57MJ58CwBmI3o9ob0t01cGtH8sJCxPnqaZBvpIqZJe-khQID4QopeemTKVLjQbmcyqK
apache hadoop:
http://hadoop.apache.org/
2.Ambari介绍
Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。Ambari目前已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeper、Sqoop和Hcatalog等。Ambari 跟 Hadoop 等开源软件一样,也是 Apache Software Foundation 中的一个项