先上类图:
FileInputFormat中比较重要的方法:
listStatus:List input directories.
getSplits:Generate the list of files and make them into FileSplits.
===========================================================
下面几个参数可以用于配置FileInputFormat:
mapred.input.pathFilter.class:输入文件过滤器,通过过滤器的文件才会加入InputFormat;
mapred.min.split.size:最小的划分大小;
mapred.max.split.size:最大的划分大小;
mapred.input.dir:输入路径,用逗号做分割。
===========================================================