1、UTF-8 编码的非断空格(对应 Unicode 码点为 \u00A0)
这种空格在网页中常见(HTML 中的 ),用于阻止文本在换行时被分割。由于它不是标准空格(ASCII 20),使用TRIM 函数无法直接去除。
1、检查空白字符的编码,获取字符的ASCII码或Unicode值
--获取末尾字符的十六进制编码:
HEX(SUBSTR(tt.obj_name, -1))
去掉全部C2A0的空格:REGEXP_REPLACE(tt.obj_name,‘\u00A0’,‘’)
去掉首尾含C2A0的空格:REGEXP_REPLACE(tt.obj_name,‘(\u00A0)+$’,‘’))