15、基于 Apache Pig 的数据分析指南

最新推荐文章于 2025-08-23 14:20:08 发布

异步汪仔

最新推荐文章于 2025-08-23 14:20:08 发布

阅读量35

点赞数

CC 4.0 BY-SA版权

分类专栏：探索Hadoop 2的无限可能文章标签： Apache Pig Pig Latin 数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/d3e4f/article/details/150106660

探索Hadoop 2的无限可能专栏收录该内容

30 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

基于 Apache Pig 的数据分析指南

1. 运行 Pig

Pig 是一个能将 Pig Latin 语句进行翻译并执行的工具，它有两种运行模式：
- 单机模式 ：在单台机器上以独立模式运行。
- 分布式模式 ：在完整的 Hadoop 集群上运行。在分布式模式下，Pig 的主要作用是将 Pig Latin 语句转换为 MapReduce 作业，无需安装额外的服务或守护进程，它作为命令行工具结合相关库使用。

Cloudera CDH 附带的是 Apache Pig 0.12 版本，也可以从 https://pig.apache.org/releases.html 获取 Pig 的源代码和二进制发行版。

运行 Pig 脚本时，MapReduce 模式是默认模式，需要访问 Hadoop 集群和 HDFS 安装。执行脚本的命令如下：

$ pig -f <script>

可以通过命令行传递参数，使用 -param <param>=<val> ，示例如下：

$ pig –param input=tweets.txt

也可以在参数文件中指定参数，使用 -pa

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。