pig 源码分析

本文介绍Pig如何通过ANTLR生成语法树,并遵循规则生成逻辑计划(logicalPlan)。每个逻辑计划由多个操作符组成,这些操作符是Pig的基本操作单元。之后,逻辑计划被转换成物理计划(physicalPlan),并最终转化为MapReduce计划(mrPlan),实现从加载到存储的数据处理过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

先贴几张pig的部分类图:

 

 

 pig logicalPlan转换为physicalPlan的类图

 

 

 

logicalPlan生成mapreducePlan类图

 

pig的主要流程 使用antlr生成语法树,

对照规则rule生成logicalPlan,每个logicalPlan聚合多个operator,operator就是pig的一个原子操作

再转化为physicalPlan,每个physicalPlan都对应hadoop job的输入输出流

最后转化为mrPlan,每个mrPlan都是包含一个load到store的过程,聚合physicalPlan,可转化为hadoop job

 

 

 

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值