这个是我在准备用HTMLParser解析一段html的时候出错的,在网上查了一下,原来是print()函数自身有限制,不能完全打印所有的unicode字符,所以只要规定一下print的打印的默认编码就行了:
import io
import sys
import urllib.request
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf8') #改变标准输出的默认编码
| 编码名称 | 用途 |
| utf8 | 所有语言 |
| gbk | 简体中文 |
| gb2312 | 简体中文 |
| gb18030 | 简体中文 |
| big5 | 繁体中文 |
| big5hkscs | 繁体中文 |
本文介绍了解决在使用HTMLParser解析HTML时遇到的Unicode字符打印不全的问题,通过设置print函数的默认编码为UTF-8,确保了所有Unicode字符都能正确显示。
10万+

被折叠的 条评论
为什么被折叠?



