
一、需求背景
数据检查方案中,对文本属性值的检查一般包括以下内容:
-
检查属性值中不能含有不合理的标点符号(“,”、“?”、空格、换行符等);
-
确认全部属性字段是否为半角;
-
名称简称中不能出现异常字符;
……
而我们在属性表中处理文本类型字段属性值时,也常碰到这样的烦恼:
-
一次只能处理一个字段;
-
一次只能处理一种非法字符类型;
-
字段计算器一运算,想反悔已经来不及;
-
文本查找与替换,又不能支持字符串两端或中间模糊匹配;
……

二、为什么要对文本属性值规范化处理?
属性值规范化处理是数据预处理的一部分,通常在数据清洗和准备阶段进行。这种处理是为了确保数据的一致性和可用性,以减少错误和提高数据的质量。以下是针对属性值规范化处理的不同需求及其原因:

最低0.47元/天 解锁文章
879

被折叠的 条评论
为什么被折叠?



