使用requests包爬取数据时,返回空的数据
原因分析:服务器会识别我们是爬虫,所以导致返回数据为空
解决办法:模拟浏览器,伪装成浏览器访问服务器
模拟浏览器:使用浏览器的User-Agent
这时,有的同学就要问了,怎么查看浏览器的User-Agent,这里就先展示一下如何查看浏览器的User-Agent:以谷歌浏览器为例:
1.在地址栏输入about://version如图所示:
2.将红框中的数据复制出来:
3.代码中使用requests库访问服务器时带上User-Agent数据:
header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) " \
"AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.61 Safari/537.36"}
f = requests.get(url, headers = header)