东是汉字“东”的Unicode编码的十进制表示;
char t = (char)19996;
就将该编码值转换成了相应的字符“东”;
import re
company = '东莞市陈珊服饰源头厂家'
if '&#' in company :
new_a_list = re.findall(r'&#(\d+?);', company )
company = ''
for m in new_a_list:
company += unichr(int(m))
print(company )
输出:东莞市陈珊服饰源头厂家


本文通过一个具体的示例,展示了如何在Python中将Unicode编码转换为对应的汉字字符。通过使用正则表达式提取字符串中的Unicode编码,再利用unichr()函数将其转换成相应的汉字,实现了对含有特殊编码字符串的正确解析。

被折叠的 条评论
为什么被折叠?



