爬虫过程报错:http.client.RemoteDisconnected: Remote end closed connection without response
因为服务器根据 UA 来判断拒绝了 python 爬虫。
添加
headers = {'User-Agent': 'User-Agent:Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'}
伪装成google浏览器
本文介绍了当爬虫遇到服务器因UA而拒绝连接的情况时的解决方案。通过设置headers中的User-Agent字段为常见的浏览器标识,可以有效避免服务器拒绝爬虫请求。
8821





