hive的udtf函数一(lateral view explode源码解析)

本文详细分析了Hive中的Lateral View与UDTF函数结合使用时的工作原理,尤其是对explode函数的源码进行了解析。通过测试SQL和执行任务的步骤,解释了LateralViewForwardOperator、SelectOperator、UDTFOperator和LateralViewJoinOperator的作用。文章指出outer关键字在UDTF不产生输出行时保证原有行仍会被输出,并对比了带与不带outer的SQL区别。最后,总结了Lateral View explode操作没有shuffle的原因和设计复杂性的目的,强调了其解耦和灵活性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

hive的udtf函数一 (lateral view explode源码分析)

Lateral view与UDTF函数一起使用,UDTF对每个输入行产生0或者多个输出行。Lateral view首先在基表的每个输入行应用UDTF,然后连接结果输出行与输入行组成拥有指定表别名的虚拟表。

测试SQL:

explain select c1 as mlike from person_info
lateral view explode(likes)t1 as c1;

下图是上面SQL的hive执行任务:对每一步进行分析
在这里插入图片描述
由上面的任务我们可以发现两条线:
在这里插入图片描述
说明:
1、TableScanOperator
常规的读表操作
2、LateralViewForwardOperator
源码:

@Override
public void process(Object row, int tag) throws HiveException {
  forward(row, inputObjInspectors[tag]);
}

几乎什么都没做,数据怎么来的,还怎么送出去。作用是提示一下开始准备操作了

2-1、左侧SelectOperator
筛选出你需要的列,这里是从虚拟表中获得的

2-2-1、右侧SelectOperator
筛选出likes的列,进行数组的解析

2-2-2、右侧UDTFOperator
源码解析

@Override
public void process(Object row, int tag) throws HiveException {
  StructObjectInspector soi = (StructObjectInspector) inputObjInspectors[tag];
  List<? extends StructField> fields = soi.getAllStructFieldRefs();
 //从row里解出字段
 for (int i = 0; i < fields
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值