- 博客(2)
- 收藏
- 关注
原创 hadoop安装及配置
1、概述 CDH (Cloudera’s Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop构建,并集成了很多补丁,可直接用于生产环境。 Cloudera Manager则是为了便于在集群中进行Hadoop等大数据处理相关的服务安装和监控管理的组件,对集群中主机、Hadoop...
2019-11-08 10:25:07
473
转载 MapReduce原理和WordCount数据详细过程
转自https://www.cnblogs.com/mingyueguli/p/10368427.html 1.MapReduce原理 1.1 MapReduce简介 MapReduce是一种分布式计算模型,是Google提出的,主要用于搜索领域,解决海量数据的计算问题。 MR有两个阶段组成:Map和Reduce,用户只需实现map()和reduce()两个函数,即可实现分布式计算 ...
2019-11-08 08:38:44
783
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人