Unicode编码获得中文,再解码即可
data = "\u3010\u6f14".encode("utf-8").decode("utf-8")
爬取网页内容乱码
"æ¹\x96å\x8c\x97ç\x9c\x81".encode("raw_unicode_escape").decode()
本文探讨了Unicode编码和解码的过程,展示了如何通过Python处理中文字符和网页爬虫中遇到的乱码问题。深入解析了编码转换方法,如使用'utf-8'和'raw_unicode_escape'进行数据处理。
Unicode编码获得中文,再解码即可
data = "\u3010\u6f14".encode("utf-8").decode("utf-8")
爬取网页内容乱码
"æ¹\x96å\x8c\x97ç\x9c\x81".encode("raw_unicode_escape").decode()

被折叠的 条评论
为什么被折叠?