m0_37666500-优快云博客

原创 Hadoop Mapreduce

Hadoop MapReduce 整个MR的过程可以分解为下面几步读取数据 Map reduce output Hadoop 读取数据通过InputFormat决定读取的数据的类型，然后拆分成一个个InputSplit，每个InputSplit对应一个Map处理，RecordReader读取InputSplit的内容给Map 通过InputFormat决定读取的数据的类型功能验证...

2019-02-24 15:29:27 266

原创 YARN基本原理和YARN工作流程

Mapreduce 1.0 旧的MapReduce架构旧的MapReduce架构、基本概念 JobTracker: 负责资源管理，跟踪资源消耗和可用性，作业生命周期管理（调度作业任务，跟踪进度，为任务提供容错） TaskTracker: 加载或关闭任务，定时报告认为状态旧的架构的问题 JobTracker是MapReduce的集中处理点，存在单点故障 JobTracker完成了太多的...

2019-02-20 23:30:09 1352

原创 Hadoop-HDFS基本原理

Hadoop （HDFS） Hadoop Distributed File System，分布式文件系统架构中的基本概念 block 基本存储单位，一般64M，比数据库中的页要大很多基本的读写单位，类似于磁盘的页，每次都是读写一个块每个块都会被复制到多台机器，默认复制3份配置大的block 减少搜寻时间，一般硬盘传输速率比寻道时间要快，大的块可以减少寻道时间每个块都需要在Name...

2019-02-19 22:38:50 244

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人