hadoop的选型

本文介绍了Apache Hadoop、CDH和HDP三个版本的区别。Apache Hadoop在整合多个框架时可能出现jar包冲突,不适合生产环境。CDH提供统一配置,文档丰富,与Spark合作紧密,适用于生产,但不完全开源。HDP则基于原版Apache Hadoop,安装管理相对复杂。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

hadoop其实常用的有3个版本:

      Apache Hadoop

      CDH:Cloudera Distributed Hadoop

      HDP:Hortoworks Data Platform

      他们的区别在于,Apache Hadoop它里面的框架只是解决了单个框架的问题,如果你要将hadoop、hive、hbase综合起来使用的话,会有很多jar包冲突的问题,不建议生产使用.

       CDH的版本,可以通过页面进行配置,文档非常给力,与spark有合作,非常适合用于生产.

下载地址:http://archive.cloudera.com/cdh5/cdh/5/

比如hadoop-2.6.0-cdh5.7.0.tar.gz,通过cdh5.7.0可以找到hadoop生态其他的框架,比如hive,hbase。只要都是cdh5.7.0,就不会有jar包冲突,对比 Apache的版本,就省了不少事,目前市面上70%左右的公司选用此版本,缺点是不开源,遇到了问题,不方便快速定位.

       HDP使用的是原版的hadoop,也就是apache的,安装删除比较费劲.

       

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值