Hadoop 大数据生态

什么是 Hadoop?

狭义

指 Hadoop 框架, 大数据必备框架, Apache 下开源的分布式系统基础框架, 主要解决海量数据的存储和分析计算问题

广义

指Hadoop生态圈, 包含大量用于大数据储存, 管理, 传输, 分析计算的框架
Hadoop生态圈

Hadoop 的三大发行版本

Apache、Cloudera、Hortonworks

  • Apache 版本最原始(最基础)的版本,对于入门学习最好
  • Cloudera 在大型互联网企业中用的较多
  • Hortonworks 文档较好

Hadoop 的优势

高可靠, 高扩展, 高容错, 高效

Hadoop 组成

Hadoop1.x和Hadoop2.x的区别
Hadoop1.x MapReduce 同时处理业务逻辑运算和资源调度, 耦合性高
Hadoop2.x 进行改进, 增加 Yarn, Yarn 负责任务调度, MapReduce 负责运算

大数据生态

大数据生态体系

官方网站

http://hadoop.apache.org/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值