最近开始学爬虫。想把目标网页的源代码抄下来研究研究,却出现了如图的错误。
上网查了一下,是编码问题。
只要指定打开时的编码方式就可以解决了。
f = open("a/a/a.txt", 'w', encoding = 'utf-8')
本文介绍了一种在进行网页爬虫时遇到的源代码抓取编码问题及其解决方案。通过指定正确的文件编码方式(如utf-8),可以有效避免因编码不匹配导致的数据乱码现象。
最近开始学爬虫。想把目标网页的源代码抄下来研究研究,却出现了如图的错误。
上网查了一下,是编码问题。
只要指定打开时的编码方式就可以解决了。
f = open("a/a/a.txt", 'w', encoding = 'utf-8')
1048
1万+

被折叠的 条评论
为什么被折叠?
