定义:Mapreduce是一个分布式运算程序的编程框架,是用户开发“基于hadoop的数据分析应用”的核心框架。
特点:Mapreduce数据源是静态的,每个MapReduce作业的输出结果都会写入磁盘,会产生磁盘IO。
1、分布是的运算程序往往需要分成至少2个阶段
2、第一阶段的mapreduce并发运行,互不相干
3、mapreduce编程中只能包含一个map阶段,一个reduce 阶段。
4、如果用户的业务逻辑比较复杂,那就只能多个mapreduce程序,串行运行
定义:Mapreduce是一个分布式运算程序的编程框架,是用户开发“基于hadoop的数据分析应用”的核心框架。
特点:Mapreduce数据源是静态的,每个MapReduce作业的输出结果都会写入磁盘,会产生磁盘IO。
1、分布是的运算程序往往需要分成至少2个阶段
2、第一阶段的mapreduce并发运行,互不相干
3、mapreduce编程中只能包含一个map阶段,一个reduce 阶段。
4、如果用户的业务逻辑比较复杂,那就只能多个mapreduce程序,串行运行