1
addInputPath()和addInputPaths()方法可以将一个或多个路径加入路径列表。可以分别调用这两种方法来建立路径列表。setInputPaths()方法一次设定完整的路径列表(替换前面调用中在Job上设置的所有路径)
2
一个路径可以表示一个文件,一个目录或是一个glob,即一个文件和目录的集合。路径是目录的话,表示要包含这个目录下所有的文件,这些文件都作为作业的输入。
3
本文介绍了Hadoop中如何使用addInputPath(), addInputPaths() 和 setInputPaths() 方法配置作业输入路径。这些方法用于指定一个或多个文件、目录或文件集合作为Hadoop任务的数据源。
1
addInputPath()和addInputPaths()方法可以将一个或多个路径加入路径列表。可以分别调用这两种方法来建立路径列表。setInputPaths()方法一次设定完整的路径列表(替换前面调用中在Job上设置的所有路径)
2
一个路径可以表示一个文件,一个目录或是一个glob,即一个文件和目录的集合。路径是目录的话,表示要包含这个目录下所有的文件,这些文件都作为作业的输入。
3
9950

被折叠的 条评论
为什么被折叠?