
Pig
韩王-信
无成有终含章可贞
展开
-
Pig 12.0 发布
Pig 12.0 已经发布,根据发布文档中说这次主要增加了IN /CASE的操作,但是截至今天12.0的文档依然是旧的通编没有关于CASE的相关信息,估计还没有来得及更新。在APACHE的JIRA上找到了相关的信息,https://issues.apache.org/jira/browse/PIG-3280。 到此为止pig终于结束了没有分支语句的历史,在以往的版本中要想使用分支语句得写多个fil原创 2013-10-16 11:02:24 · 655 阅读 · 0 评论 -
pig 次数统计和列传行
b= foreach a generate TOKENIZE(line) as word; ({(air),(2013),(us),(eu),(20)}) ({(air),(2013),(us),(eu),(30)}) ({(air),(2012),(us),(eu),(40)}) ({(hotel),(2013),(us),(eu),(20)}) ({(hotel),(2013原创 2013-09-29 14:27:34 · 991 阅读 · 0 评论 -
pig Casting Relations to Scalars
grunt> describe b; b: {f: chararray,m: chararray,l: chararray} grunt> c = group b all; grunt> describe c; c: {group: chararray,b: {(f: chararray,m: chararray,l: chararray)}} grunt> d = foreach原创 2013-09-29 11:05:36 · 860 阅读 · 0 评论 -
pig Disambiguate Operator
a = load '/usr/egencia/go.txt' AS name:tuple(f:chararray,m:chararray,l:chararray); grunt> describe a; a: {name: (f: chararray,m: chararray,l: chararray)} grunt> b = foreach a generate FLATTEN(n原创 2013-09-29 10:27:12 · 716 阅读 · 0 评论 -
pig测试数据
hdfs上的数据源如下: grunt> cat /usr/egencia/travler/2.txt air:343;hotel:45;train:54467;nation:china air:367;hotel:456;train:5567;nation:china air:356;hotel:4522;train:54367;car:454;nation:china air:343原创 2013-09-23 17:19:32 · 1680 阅读 · 0 评论