第一,已经学习了hadoop的MR编程架构,但是对于数据串行格式化并未深刻理解,并且对于boolm filter以及map join的理解不够深刻,另外还必须学习cache体系对join的意义。
其次,并未深刻理解mahout算法库对数据处理的程序编写以及运用实践的结合,还应该仔细阅读各案例源码的设计思路。
对于inpress和enpress的演技暂时放弃。
第一,已经学习了hadoop的MR编程架构,但是对于数据串行格式化并未深刻理解,并且对于boolm filter以及map join的理解不够深刻,另外还必须学习cache体系对join的意义。
其次,并未深刻理解mahout算法库对数据处理的程序编写以及运用实践的结合,还应该仔细阅读各案例源码的设计思路。
对于inpress和enpress的演技暂时放弃。