1. 考虑如何高效利用对象引用,而不是频繁的创建新的对象,所以在能够看到的一些示例代码中,一些对象放到了map、reduce函数外部,定义成了类的成员
2. 尤其注意在Reduce端,一定要重新构造需要处理的数据对象,迭代器中每次返回的对象都是同一个Object,但是具有不同的值.注意,一定要注意.
3. 诸如 Mapper、Reducer类的实现,一般还是放在Main类中比较好,作为静态类出现
4. System.out.println 的输出在http://127.0.0.1:50030/控制界面中,看各个任务的日志