hive数据精度问题

本文介绍了在Hive查询过程中遇到的数据精度丢失问题及其解决办法。由于线上数据库表的字段被设置为string类型,在进行算术运算时出现了精度丢失的情况。通过使用cast函数将字段类型转换为decimal(38,2),成功解决了这一问题。

工作用遇到hive查询中sum数据精度丢失问题。

问题描述:公司大数据组把线上数据库表的类型简单粗暴的设置为string类型了,我在hive上做算数运算时精度丢失。

处理方案:使用cast(table.column_name as decimal(38,2)) 将string类型转换成decimal(38,2)为保留两位小数。


另外还使用了下regexp正则。

case when orders.name regexp '\\d+秀点' then '秀点'
else orders.name end



Hive中double精度不够时,可采用以下解决方法: ### 使用DECIMAL数据类型 Hive的DECIMAL数据类型可用于存储具有精确精度的十进制数,能避免double类型带来的精度丢失问题。创建表时,可指定DECIMAL类型及其精度和标度。例如: ```sql CREATE TABLE example_table ( decimal_column DECIMAL(38, 10) ); ``` 上述代码创建了一个名为`example_table`的表,其中`decimal_column`列的数据类型为DECIMAL,精度为38,标度为10。插入数据时,可直接插入精确的十进制值: ```sql INSERT INTO example_table VALUES (9813113054842627.00); ``` ### 使用字符串类型存储精确值 若需要存储非常大的精确数值,可考虑使用字符串类型(如STRING)存储数值的字符串表示形式。这样能避免数值类型带来的精度丢失问题,但在进行数值计算时,需先将字符串转换为合适的数值类型。例如: ```sql CREATE TABLE string_table ( string_column STRING ); INSERT INTO string_table VALUES ('9813113054842627'); ``` 在进行计算时,可使用Hive的内置函数将字符串转换为DECIMAL类型: ```sql SELECT CAST(string_column AS DECIMAL(38, 0)) FROM string_table; ``` ### 调整Java程序处理逻辑 若数据是从Java程序导入到Hive的,可在Java程序中使用`BigDecimal`类处理精确的十进制数,避免使用`double`类型。例如: ```java import java.math.BigDecimal; public class DecimalExample { public static void main(String[] args) { String s1 = "9813113054842627"; BigDecimal bd = new BigDecimal(s1); System.out.println(bd); } } ``` 在将数据导入Hive时,可将`BigDecimal`对象转换为字符串,然后插入到Hive的STRING或DECIMAL类型列中。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值