环境:
CentOS6.5, Hadoop1.1.2, jdk1.6, pig 0.11.1
一、下载并解压pig安装包
可从以下链接下载;
pig-0.11.1.tar.gz
二、设置环境变量
1. 设置java环境变量
export JAVA_HOME=<JAVA_HOME>
export PATH=.:$JAVA_HOME/bin:$PATH
2. 设置hadoop环境变量
export HADOOP_HOME=<HADOOP_HOME>
export PATH=.:$HADOOP_HOME/bin:$PATH
3. 设置pig环境变量
export PIG_HOME=<HBASE_HOME>
export PATH=.:$PIG_HOME/bin:$PATH
4. 设置PIG_CLASSPATH环境变量
export PIG_CLASSPATH=<HADOOP_HOME>/conf
三、修改hosts文件
#使本机能够解析主机名为ip
四、启动grunt shell
1. pig -x local #本机模式启动
CentOS6.5, Hadoop1.1.2, jdk1.6, pig 0.11.1
一、下载并解压pig安装包
可从以下链接下载;
pig-0.11.1.tar.gz
二、设置环境变量
1. 设置java环境变量
export JAVA_HOME=<JAVA_HOME>
export PATH=.:$JAVA_HOME/bin:$PATH
2. 设置hadoop环境变量
export HADOOP_HOME=<HADOOP_HOME>
export PATH=.:$HADOOP_HOME/bin:$PATH
3. 设置pig环境变量
export PIG_HOME=<HBASE_HOME>
export PATH=.:$PIG_HOME/bin:$PATH
4. 设置PIG_CLASSPATH环境变量
export PIG_CLASSPATH=<HADOOP_HOME>/conf
三、修改hosts文件
#使本机能够解析主机名为ip
四、启动grunt shell
1. pig -x local #本机模式启动
2. pig #Map/Reduce模式启动
五、pig shell 文件系统操作
#在grunt shell中输入help, 查看信息:
"cat" ...
"clear" ...
"cd" ...
"cp" ...
"copyFromLocal" ...
"copyToLocal" ...
"dump" ...
"describe" ...
"aliases" ...
"explain" ...
"help" ...
"history" ...
"kill" ...
"ls" ...
"mv" ...
"mkdir" ...
"pwd" ...
"quit" ...
"register" ...
"using" ...
"as" ...
"rm" ...
"set" ...
"run" ...
"exec" ...
"scriptDone" ...
<IDENTIFIER> ...
<PATH> ...