1.mapreduce.input.linerecordreader.line.maxlength .
当使用TextInputFormat作为inputformat时,会遇文件中一些行过长,这样,我们可以通过这个mapreduce.input.linerecordreader.line.maxlength 来跳过这些异常行。
- mapreduce.input.keyvaluelinere.cordreader.key.value.separator
针对一个文件中既有键又有值为情况,键和值之间的分隔符可以通过这个属性值来确定。默认是tab键
3.mapreduce.input.line.inputformat.linespermap
使用TextInputFormat,KeyValueTextInputFormat,mapper处理的行数是不固定的。如果需要每个mapper处理的行数是固定的,可以使用NLineInputFormat。,那么通过mapreduce.input.line.inputformat.linespermap这个属性就可以确定每个mapper处理多少行。