二、为什么需要mapreduce
==============================================================================
-
海量数据在单机上处理因为硬件资源限制,无法胜任
-
而一旦将单机版程序扩展到集群来分布式运行,将极大增加程序的复杂度和开发难度
-
引入 MapReduce 框架后,开发人员可以将绝大部分工作集中在业务逻辑的开发上,而将 分布式计算中的复杂性交由框架来处理
三、mapreduce程序运行实例
======================================================&#