hadoop自我学习规划

本文探讨了Hadoop的MapReduce编程模型及其关键组件如序列化格式、Bloom Filter和Map Join的理解,并进一步讨论了Cache体系在Join操作中的作用。此外,文中还涉及了Mahout算法库的应用实践及案例源码分析。

第一,已经学习了hadoop的MR编程架构,但是对于数据串行格式化并未深刻理解,并且对于boolm filter以及map join的理解不够深刻,另外还必须学习cache体系对join的意义。

其次,并未深刻理解mahout算法库对数据处理的程序编写以及运用实践的结合,还应该仔细阅读各案例源码的设计思路。

对于inpress和enpress的演技暂时放弃。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值