2021-06-04
最新推荐文章于 2024-04-22 07:01:15 发布
本文详细讲解Python爬虫中文乱码问题。爬取诗词名句网的三国演义时,出现中文字符编码错误。经比较,网页字符格式为‘utf - 8’,而爬虫代码中requests.get()得到的encoding为‘ISO - 8859 - 1’。解决办法是将爬虫代码中的encoding替换成‘utf - 8’。
本文详细讲解Python爬虫中文乱码问题。爬取诗词名句网的三国演义时,出现中文字符编码错误。经比较,网页字符格式为‘utf - 8’,而爬虫代码中requests.get()得到的encoding为‘ISO - 8859 - 1’。解决办法是将爬虫代码中的encoding替换成‘utf - 8’。
453
648
224
2950
1041

被折叠的 条评论
为什么被折叠?