Pig内置函数

类别
数名称
描述
计算
AVG                    
计算包中项的平均值

CONCAT
把两个字节数组或者字符数组连接成一个

COUNT
计算包中非空值的个数

COUNTSTAR
计算包中项的个数,包括空值

 DIFF
计算两个包的差

MAX
 计算包中项的最大值

MIN
计算包中项的最小值

SIZE           
计算一个类型的大小,数值型的大小为1;
 对于字符数组,返回字符的个数;
 对于字节数组,返回字节的个数;
 对于元组,包,映射,返回其中项的个数。

SUM           
计算一个包中项的值的总和

TOKENIZE       
对一个字符数组进行标记解析,并把结果词放入一个包
过滤   
IsEmpty           
判断一个包或映射是否为空
加载/存储
PigStorage       
用字段分隔文本格式加载或存储关系,这是默认的存储函数

BinStorage       
从二进制文件加载一个关系或者把关系存储到二进制文件

BinaryStorage       
从二进制文件加载只是包含一个类型为bytearray的字段的元组到关系,或以这种格式存储一个关系

TextLoader       
从纯文本格式加载一个关系

PigDump           
用元组的tostring()形式存储关系
    

       

来源:Hadoop权威指南   Tom White 著


 

     

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值