详解Hadoop中的LineReader的readLine函数
Hadoop中的LineReader的readLine函数可以说写的很不错,这里结合自己的理解,详细的添加了注释。该函数最精彩的一点就是保证了读取分片的时候不会出现断行,针对不同的文件系统,能够做到正确的判断行结束的位置,从而准确的读出文本中的一行内容。
1、如果当前字符是’\r’,虽然不能立即确定是不是读到行尾了(后面可能跟着’\n’),但是这行的内容已经确定了,就是行结束符的长度没有确
原创
2016-08-06 20:12:27 ·
3274 阅读 ·
1 评论