工作用遇到hive查询中sum数据精度丢失问题。
问题描述:公司大数据组把线上数据库表的类型简单粗暴的设置为string类型了,我在hive上做算数运算时精度丢失。
处理方案:使用cast(table.column_name as decimal(38,2)) 将string类型转换成decimal(38,2)为保留两位小数。
另外还使用了下regexp正则。
case when orders.name regexp '\\d+秀点' then '秀点'
else orders.name end
本文介绍了在Hive查询过程中遇到的数据精度丢失问题及其解决办法。由于线上数据库表的字段被设置为string类型,在进行算术运算时出现了精度丢失的情况。通过使用cast函数将字段类型转换为decimal(38,2),成功解决了这一问题。
1471

被折叠的 条评论
为什么被折叠?



