hive自定义函数-uuid

将Oracle存储过程业务迁移到Hive时,由于Hive内建函数不支持Oracle的SYS_GUID(),故需自定义UDF来生成UUID。本文介绍了如何参照Hive的rand()函数源码,创建一个非确定性的UDF,用于在Hive中生成32位的UUID。

 

 

0 业务目的:

 

将oracle的存储过程业务搬迁到hive, 因此涉及不少 sql ---> hql的替换工作,基本都能实现,

hive函数不支持的oracle函数功能的就用自定义函数,遇到join的不等值连接就用mr实现,

 

现在说说 oracle中insert表中

 

insert into table f_ent_norm_statistics

select xxx  , SYS_GUID() ;

 

oracle的SYS_GUID() 是生成32位byte的uuid,hive的rand()达不到这个目的,因此需要自定义,

这里参考下 rand源码:

@Description(name = "rand",
    value = "_FUNC_([seed]) - Returns a pseudorandom number between 0 and 1")
@UDFType(deterministic = false)
@VectorizedExpressions({FuncRandNoSeed.class, FuncRand.class})
public class UDFRand extends UDF {
  private Random random;

  private final DoubleWritable result = new DoubleWritable();

  public UDFRand() {
  }

  public DoubleWritable evaluate() {
    if (random == null) {
      random = new Random();
    }
    result.set(random.nextDouble());
    return result;
  }

  public DoubleWritable evaluate(LongWritable seed) {
    if (random == null) {
      random = new Random(seed.get());
    }
    result.set(random.nextDouble());
    return result;
  }

}

 

主要是

1 random = new Random(seed.get());

2 @UDFType(deterministic = false)  如果不加入这句,那么hql跑的时候只会返回一个值。

 

 

下面是我的 udf uuid写法:

/**
 * 
 * @author zm
 * return uuid of 32bytes
 * eg: return  F18031C69D8345DEB305D4B2E796A282   like oracle SYS_GUID()
 */
@UDFType(deterministic = false)
public class SysGuidFun  extends UDF{ 

	 public Text evaluate() {
		
	   String id = UUID.randomUUID().toString();   
	   id = id.replace("-", ""); 
      
	   return new Text(id);	
	 }
	 
}

 

 

 

 

 

 

 

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值