hive中的特殊字符

1、​​UTF-8 编码的非断空格(对应 Unicode 码点为 \u00A0)
这种空格在网页中常见(HTML 中的  ),用于阻止文本在换行时被分割。由于它不是标准空格(ASCII 20),使用TRIM 函数无法直接去除。

1、检查空白字符的编码,获取字符的ASCII码或Unicode值

--获取末尾字符的十六进制编码:
HEX(SUBSTR(tt.obj_name, -1)) 

去掉全部C2A0的空格:REGEXP_REPLACE(tt.obj_name,‘\u00A0’,‘’)
去掉首尾含C2A0的空格:REGEXP_REPLACE(tt.obj_name,‘(\u00A0)+$’,‘’))

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值