try:
return text.decode('utf-8')
except:
try:
return text.decode('cp1252', 'replace')
except:
try:
return text.decode('iso-8859-1')
except:
pass
本文介绍了一种针对不同编码格式的文本解码策略。当遇到无法直接用UTF-8解码的文本时,会尝试使用cp1252编码进行解码,并启用替换模式处理未知字符。如果仍然失败,则采用iso-8859-1编码尝试解码。
679
225

被折叠的 条评论
为什么被折叠?