hadoop 简单入门与streaming常用配置参数说明

1. Hadoop包含两核心部分

  1. hdfs
    1. Hadoop distribute file system -- hadoop分布式文件系统,存储数据
    2. NamenodeDatanode
    3. 常用命令形式hadoop fs -ls  /  hadoop fs -mkdir
  2. MapReduce
    1. 分而治之;map:实现分治;reduce:实现合并
    2. 解决数据可分割的计算问题
    3. 编程接口:常用Streaming;组成Job配置文件、map函数,reduce函数

2. hdfs结构图

  1. Namenode存储元数据,数据信息,数据备份信息
  2. Datanode 数据备份:本机架备份、异地备份

3. MapReduce调度框架

  1. JobClient<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值