废话不多说
爬虫其实就是我们用代码去模仿浏览器发送请求,模仿的像不像就关系到我们爬虫的成功率
提高这个成功率,有如下几个要点
1.请求头没有模仿完整
2.复制请求头时,有个**Accept-Encoding:gzip,deflate,**这是压缩类型有这个请求头的话,返回响应信息时就是压缩过的,后面就要有解压缩的步骤如果不会解压缩,那么干脆 请求头里把这句注释了,不需要压缩
3.还有个 Content-Length:120 内容长度,也别加,网页会自动算出来,如果写的不对
可能会爬取失败
Python爬虫报错 初入爬虫要注意的点
最新推荐文章于 2020-04-20 20:36:46 发布