A = LOAD 'input' using PigStorage(',','-tagsource');
B = foreach A generate $0;
PigStorage构造函数第一个参数是分隔符,第二个参数如果为“-tagsource”则会在A第一列放置文件名信息。
参考:http://pig.apache.org/docs/r0.11.0/api/org/apache/pig/builtin/PigStorage.html
本文详细解释了Apache Pig中PigStorage构造函数的用法,特别是当其第二个参数设置为'tagsource'时,如何在数据集的第一列放置文件名信息。通过实例演示,帮助读者掌握这一功能在数据处理流程中的应用。
A = LOAD 'input' using PigStorage(',','-tagsource');
B = foreach A generate $0;
PigStorage构造函数第一个参数是分隔符,第二个参数如果为“-tagsource”则会在A第一列放置文件名信息。
参考:http://pig.apache.org/docs/r0.11.0/api/org/apache/pig/builtin/PigStorage.html

被折叠的 条评论
为什么被折叠?