昨天终于把输入文件搞清楚了, 知道了HDFS里到底在一个任务开始的时候上传了哪些文件和怎样分割文件的。具体的内容有空放在博客上吧,现在需要继续看下去,下一步要做的事情就是搞清map任务怎么做到本地化和hadoop如何实现序列化的,还有一段路要走啊,学习效率很低,很烦,老是被无聊的事烦心,戒焦戒躁吧。
如果有人有需要,可以给我留言,我会及时把我看到的东西给大家分享
本文详细介绍了Hadoop中文件的上传与分割过程,并探讨了map任务的本地化及Hadoop序列化机制。作者分享了自己在学习过程中遇到的问题及解决思路。
昨天终于把输入文件搞清楚了, 知道了HDFS里到底在一个任务开始的时候上传了哪些文件和怎样分割文件的。具体的内容有空放在博客上吧,现在需要继续看下去,下一步要做的事情就是搞清map任务怎么做到本地化和hadoop如何实现序列化的,还有一段路要走啊,学习效率很低,很烦,老是被无聊的事烦心,戒焦戒躁吧。
如果有人有需要,可以给我留言,我会及时把我看到的东西给大家分享
3864

被折叠的 条评论
为什么被折叠?