hadoop不同版本有哪些

本文介绍了Hadoop的概念及其作为分布式系统基础架构的作用,探讨了Hadoop如何应对大数据处理的挑战。此外,文中还概述了几种主要的Hadoop版本,包括Apache Hadoop 2.0、Cloudera Hadoop及Hortonworks等,并提到了一些国产Hadoop发行版。

一、Hadoop是什么?

首次听到hadoop这次单词,相信很多人跟我当时是一样,不免心中画上一个大大的问号——这是什么东西?Hadoop是什么?百度百科的解释是:Hadoop是一个由Apache基金会所开发的分布式系统基础架构换句话说就是hadoop一个能够对大量数据进行分布式处理软件框架

Hadoopd之所谓会诞生,主要是由于进入到大数据时代,计算机需要处理的数据量太过庞大。这时就需要将这些庞大数据切割分配到N台计算机进行处理。当大量信息被分配到不同计算机进行处理时,要确保最终得到的结果正确就需要对这些分布处理的信息进行管理,hadoop就是这样的一套解决方案。

通过一个简单通俗的例子说明:假如说你有一个篮子水果,你想知道苹果和梨的数量是多少,那么只要一个一个数就可以知道有多少了。如果你有一个集装箱水果,这时候就需要很多人同时帮你数了,这相当于多进程或多线程。如果你很多个集装箱的水果,这时就需要分布式计算了,也就是Hadoop

二、hadoop的版本

随着这几年大数据浪潮的兴起,hadoop的各种版本也快速在国内流传和使用。当前主要的hadoop版本有以下几种:

1、Apache hadoop 2.0版本,它的模块主要有以下几个:

(1)hadoop通用模块,支持其他hadoop模块的通用工具集;

(2)Hadoop分布式文件系统,支持对应数据高吞吐量访问的分布式文件系统;

(3)用于作业调度和集群资源管理的Hadoop YANRN框架;

(4)Hadoop MapReduce,基于YARN的大数据并行处理系统

2Cloudera hadoopCloudera版本层次更加清晰,且它提供了适用于各种操作系统的Hadoop安装包,可直接使用apt-get或者yum命令进行安装,更加省事。

3HortonworksHortonworks 的主打产品是Hortonworks Data Platform (HDP),也同样是100%开源的产品,HDP除了常见的项目外还包含了Ambari,一款开源的安装和管理系统。HCatalog,一个元数据管理系统,HCatalog现已集成到Facebook 开源的Hive中。HortonworksStinger开创性地极大地优化了Hive项目。Hortonworks为入门提供了一个非常好的,易于使用的沙盒。Hortonworks开发了很多增强特性并提交至核心主干,这使得Apache Hadoop能够在包括Windows ServerWindows Azure在内的Microsoft Windows平台上本地运行。

三、国产hadoop发行版有哪些

国内做hadoop发行版的像华为大快搜索都有推出自己的发行版。华为在硬件上有天然的有事,华为的FusionInsight Hadoop版本基于Apache Hadoop,构建NameNodeJobTrackerHiveServerHA功能,进程故障后系统自动Failover,无需人工干预,这个也是对Hadoop的小修补,远不如MapR解决的彻底。

大快搜索推出的DKhaoop, 是目前已知的国产发行版中唯一一个纯原生态的开发,集成了整个HADOOP生态系统的全部组件,并深度优化,重新编译为一个完整的更高性能的大数据通用计算平台,实现了各部件的有机协调。因此DKH相比开源的大数据平台,在计算性能上有了高达5倍(最大)的性能提升。


### Hadoop 不同版本概述 Hadoop 发展过程中经历了多个重要版本迭代,主要可以分为两大代际: #### 第一代 Hadoop (Hadoop 1.0) 这一阶段的核心组件包括单一的NameNode和Secondary NameNode以及多个DataNode来构成分布式文件系统(HDFS),还有用于处理大规模数据集的MapReduce计算框架[^1]。 #### 第二代 Hadoop (Hadoop 2.0) 相比之前版本,在架构上进行了优化改进。引入了YARN作为资源管理器,使得集群能够支持更多种类的应用程序运行,并增强了系统的可扩展性和可靠性。 ### Apache Hadoop 官方版本 Apache基金会发布的原生Hadoop是最基础也是最纯粹的形式,它代表了社区共同开发维护的结果。在中国市场中被广泛采用,尤其是在科研和技术探索领域有着重要的地位[^2]。 ### 商业化发行版 除了官方版本外,还有一些基于Apache Hadoop定制的企业级解决方案提供给用户选择: - **Cloudera CDH**: 提供了不同层次的服务选项,从完全开放源码到带有高级特性的付费订阅服务不等; - **Hortonworks Data Platform (HDP)**: 强调其产品线保持100%开源特性,旨在为企业用户提供稳定可靠的大数据分析平台。 ### 版本安装指南示例 对于具体某个版本Hadoop 2.7.7来说,配置工作涉及到编辑位于`/usr/local/hadoop-2.7.7/etc/hadoop`目录下的相关XML文件以适应特定部署需求[^3]。 而对于较新的Hadoop 3.2.1,则可以通过在Master节点执行命令`bin/hadoop namenode -format`来进行初始化设置[^4]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值