1、单列转换成多行
比如:
pageid paged
page1 a,b,c
要转换成
page1 a
page1 b
page1 c
select pageid,p from test lateral view explode(split(paged,',')) adtable as p;
通过split拆成多个元素的集合,再通过explode打散成多行,lateral view作用是解决explode这种UDTF函数拆成的数据不能与其他字段共同服务问题
2、多行转换成单列
即上面的结果又反推回去,想到oracle的sys_connect_path,便写个UDF实现类似功能
import java.util.ArrayList;
import org.apache.hadoop.hive.ql.exec.UDF;
public class RowToCol extends UDF {
private static int MAX_VALUE = 50;
private static String prerows[] = new String[MAX_VALUE];//全局变量,保留上一条记录的值
private static StringBuilder val=null;
public String evaluate (Object ...args){
ArrayList<String> thisrowlist=new ArrayList<String>();
for(int i=0;i<args.length;i++)
thisrowl