类别 | 函数名称 | 描述 |
计算 | AVG | 计算包中项的平均值 |
CONCAT | 把两个字节数组或者字符数组连接成一个 | |
COUNT | 计算包中非空值的个数 | |
COUNTSTAR | 计算包中项的个数,包括空值 | |
DIFF | 计算两个包的差 | |
MAX | 计算包中项的最大值 | |
MIN | 计算包中项的最小值 | |
SIZE | 计算一个类型的大小,数值型的大小为1; 对于字符数组,返回字符的个数; 对于字节数组,返回字节的个数; 对于元组,包,映射,返回其中项的个数。 | |
SUM | 计算一个包中项的值的总和 | |
TOKENIZE | 对一个字符数组进行标记解析,并把结果词放入一个包 | |
过滤 | IsEmpty | 判断一个包或映射是否为空 |
加载/存储 | PigStorage | 用字段分隔文本格式加载或存储关系,这是默认的存储函数 |
BinStorage | 从二进制文件加载一个关系或者把关系存储到二进制文件 | |
BinaryStorage | 从二进制文件加载只是包含一个类型为bytearray的字段的元组到关系,或以这种格式存储一个关系 | |
TextLoader | 从纯文本格式加载一个关系 | |
PigDump | 用元组的tostring()形式存储关系 |
来源:Hadoop权威指南 Tom White 著