abstract:
title 1
title 2
title 3
2. 疑问
$ . bin/setenv
语句是干什么的?
1. 什么是MapReduce
Map(映射):
会把交付给的一些“数据”进行处理,而且可以将有噪音的数据过滤。
Reduce(化简):
对映射得到的数据进行处理。(将碎蔬菜做成酱料?)
We want to count all the books in the library. You count up shelf #1, I count up shelf #2. That’s map. The more people we get, the faster it goes.
我们要数图书馆中的所有书。你数1号书架,我数2号书架。这就是“Map”。我们人越多,数书就更快。
Now we get together and add our individual counts. That’s reduce.
现在我们到一起,把所有人的统计数加在一起。这就是“Reduce”。