CDH与原生态hadoop之间的区别

本文对比了Cloudera的CDH与Apache Hadoop的主要区别,包括版本划分、兼容性、安全性、文档清晰度及安装方式等方面。CDH提供更稳定的版本、更强的安全性和便利的安装选项。

转载地址:https://www.cnblogs.com/shellshell/p/6102777.html

需要认识的几个问题

---------------------------------------------------------------------------------------------------------------------------

1.hadoop有几个版本?
2.CDH有几种安装方式?
3.CDH在安装认证方面做了什么改变?
----------------------------------------------------------------------------------------------------------------------------
Cloudera的CDH和Apache的Hadoop的区别  目前而言,不收费的Hadoop版本主要有三个(均是国外厂商),分别是:Apache(最原始的版本,所有发行版均基于这个版本进行改进)、Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称CDH)、Hortonworks版本(Hortonworks Data Platform,简称“HDP”),对于国内而言,绝大多数选择CDH版本,CDH和Apache版本主要区别如下:  

(1) CDH对Hadoop版本的划分非常清晰,只有两个系列的版本,分别是cdh3和cdh4,分别对应第一代Hadoop(Hadoop 1.0)和第二代Hadoop(Hadoop 2.0),相比而言,Apache版本则混乱得多;比Apache hadoop在兼容性,安全性,稳定性上有增强。  

(2)CDH3版本是基于Apache  hadoop  0.20.2改进的,并融入了最新的patch,CDH4版本是基于Apache hadoop 2.X改进的,CDH总
是并应用了最新Bug修复或者Feature的Patch,并比Apache hadoop同功能版本提早发布,更新速度比Apache官方快。

(3)安全 CDH支持Kerberos安全认证,apache hadoop则使用简陋的用户名匹配认证 

(4)CDH文档清晰,很多采用Apache版本的用户都会阅读CDH提供的文档,包括安装文档、升级文档等。 

(5)CDH支持Yum/Apt包,Tar包,RPM包,CM安装,Cloudera Manager三种方式安装,Apache hadoop只支持Tar包安装。


注:CDH使用推荐的Yum/Apt包安装时,有以下几个好处: 
1、联网安装、升级,非常方便 
2、自动下载依赖软件包 

3、Hadoop生态系统包自动匹配,不需要你寻找与当前Hadoop匹配的Hbase,Flume,Hive等软件,Yum/Apt会根据当前安装Hadoop版本自动寻找匹配版本的软件包,并保证兼容性。

4、自动创建相关目录并软链到合适的地方(如conf和logs等目录);自动创建hdfs, mapred用户,hdfs用户是HDFS的最高权限用户,mapred用户则负责mapreduce执行过程中相关目录的权限。

 

 

参考地址:http://blog.youkuaiyun.com/cnhk1225/article/details/50357744

 

CDH (Cloudera Distribution Hadoop) 华为MRS (MaxCompute, 原名MapReduce Service) 都是基于Apache Hadoop技术的企业级大数据处理解决方案,但它们之间存在一些区别: 1. **背景所有权**: - Cloudera是Hadoop的领先商业供应商之一,专注于Hadoop的商业化生态系统的发展。而CDH是其主打的产品线。 - 华为的MRS则是华为云计算平台的一部分,原生集成于FusionSphere OpenStack等环境中,主要服务于华为内部客户。 2. **定制化**: - CDH作为开源基础上的商业发行版,虽然提供了企业级支持管理工具,但相对更注重通用性灵活性,允许用户自由选择安装插件。 - MRS由华为针对中国市场客户需求进行了定制优化,可能包含了一些特定的功能性能优化,比如对本地资源的利用中国市场的法规遵从性。 3. **功能服务**: - CDH提供的组件更为全面,除了基本的Hadoop库外,还包括诸如Hive、Impala等分析工具,以及Ambari这样的集群管理工具。 - MRS则可能会结合华为云的优势,提供一站式的服务,包括数据存储、计算、BI分析甚至机器学习等功能,有时还可能整合Hadoop之外的其他华为云服务。 4. **成本支持**: - CDH通常需要用户自行购买许可证并管理,费用较高;华为MRS作为一个云服务,可能按照使用量计费,对于云上用户较为经济,而且有华为的技术支持。 总的来说,两者都是为企业提供Hadoop解决方案,但在产品特性、定制化程度服务模式等方面有所不同。企业选择时应根据自身的实际需求技术环境来确定最适合的方案。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值