python爬取页面编码格式gb2312中文乱码问题
python爬取页面编码格式gb2312中文乱码问题
python小白刚刚学习爬虫,记录一下失败到成功历程~
项目场景:
爬取某事业单位招聘的数据
问题1:
通常遇到乱码问题就是爬取一遍,哪里出现乱码修改哪里。比如乱码出现在标题,那么修改标题部分的代码;
如下:
url = 'http://www.shiyebian.net/fujian/sanming/'
page_text = requests.get(url=url,headers=headers).text
tree = e
原创
2021-04-28 00:38:37 ·
1612 阅读 ·
2 评论