排查过程简介
第一反应是comments字段超长导致数据插入异常,输出异常记录的comments值。
<span style="font-size: 12px; text-wrap-mode: nowrap;">太阳能板脱落无法质保不认可费用,电话里有长达1分多钟坐席无应答,服务礼仪存在欠缺,无法撤销不满意</span>
comments中有HTML标签,字符串实际并没有超过varchar(1024),网上说可能是编码问题导致插入异常,通过各种编码转换以及特殊字符转义的方式未解决。最后考虑将HTML的标签过滤,实际只需要中文内容。
代码修改
原代码
Comments =item[‘Comments’]
通过正则表达式删除HTML标签
修改后代码
Comments = re.sub(r’<[^>]+>', ‘’, item[‘Comments’])
3149

被折叠的 条评论
为什么被折叠?



