
Hadoop
miluroe
这个作者很懒,什么都没留下…
展开
-
Hadoop源代码分析——io.*(一)
背景知识: Hadoop类、接口的标识: Hadoop的类、接口文件都要引入两个类InterfaceAudience;InterfaceStability;InterfaceAudience用于标 记该类文件可以被访问的权限。熟悉的有public、private。LimitedPrivate 只能在归属的架构中例如HDFS、HBase中被引用。InterfaceS...2014-11-22 15:58:12 · 126 阅读 · 0 评论 -
Hadoop源代码分析——io.*(二)
从官方的WordCount中不难看出,Hadoop在读取文本时的至少要有两种分割的功能。即可以将一篇文档按行切割分离,同时可以将一行中的文本依据空格切割出来。这样,类似与Java的I/O操作,只不过是以单词为单位向下迭代。每次迭代时读出一个单词并取出。 Text word = new Text();然后word.set(itr.nextToken());c...2014-11-29 20:00:12 · 126 阅读 · 0 评论