在爬虫中有些网站会有反爬机制,简单来说就是网站看穿你就是个计算机,所以不论网站是否有反爬机制,在爬虫前使用模拟浏览器总是没错的,可是怎么获得heads中的user-agent呢?
在一个网页中,使用开发者工具,f12,然后找到网络,刷新一下,
会有一个文件,是第一个文件,双击,会出现这样的东西
其中最下面那个user-agent就是我们的爬虫头了。每个浏览器的开发者工具结构不一样,这里以edge浏览器为例,不同浏览器大同小异,都有这个。
在爬虫中有些网站会有反爬机制,简单来说就是网站看穿你就是个计算机,所以不论网站是否有反爬机制,在爬虫前使用模拟浏览器总是没错的,可是怎么获得heads中的user-agent呢?
在一个网页中,使用开发者工具,f12,然后找到网络,刷新一下,
会有一个文件,是第一个文件,双击,会出现这样的东西
其中最下面那个user-agent就是我们的爬虫头了。每个浏览器的开发者工具结构不一样,这里以edge浏览器为例,不同浏览器大同小异,都有这个。