Pig安装和简单使用(31)

本文介绍Pig框架的基本使用方法及配置步骤,并通过一个电信手机号码流量统计的实例展示了Pig在处理大规模数据集方面的高效性和灵活性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

        Pig是一个利用mapreduce进行计算的框架。有自己的一套语法Pig latin,可以非常方便的书写计算代码。

1、如何使用Pig?

     解压缩之后,修改文件conf/pig.properties,增加两行内容,如下:

            fs.default.name=hdfs://hadoop0:9000

            mapred.job.tracker=hadoop0:9001

            保存退出后,执行bin/pig进行命令行.

2、使用pig完成电信手机号码统计流量例子:

      #加载hdfs中的数据

      这里的A是别名

      A = LOAD '/Kpi' AS (f0:chararray,f1:chararray,f2:chararray,f3:chararrayf4:chararray);

      DUMP A; //查看结果A

      #过滤A中有用的字段

      B = FOREACH A GENERATE f1,f2,f3,f4;

      DUMP B; //查看结果B

      #对B中的记录按照f1进行分组

      C = GROUP B BY f1;

      DUMP C; //查看结果C

      #对分组后的记录,按照分组字段进行累加

      D = FOREACH C GENERATE group , SUM(B.f1),SUM(B.f2),SUM(B.f3);

      DUMP D; //查看结果D

      #把最后的结果保存到HDFS中

      STORE D INTO '/out';

3、以上的Pig命令可以放到一个文件中执行文件内容是如下,执行方式pig kpi.pig

     内容如同上面一样。      


                                                                                                                    Name:Xr

                                                                                                                    Date:2014-04-02 22:44

转载于:https://my.oschina.net/Xiao629/blog/215618

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值