爬虫-请求头中需要注意的反爬（特殊的X-Requested-With）

最新推荐文章于 2025-04-18 09:03:46 发布

原创

最新推荐文章于 2025-04-18 09:03:46 发布 · 3.5k 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#爬虫 #请求头 #http

本文介绍了HTTP请求头中的常见字段，特别是强调了X-Requested-With字段在反爬策略中的作用。当进行Ajax异步请求时，此字段用于标识请求类型，若缺失可能会导致服务器拒绝访问，是爬虫开发者需要注意的关键点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

爬虫-请求头中需要注意的反爬（特殊的X-Requested-With）

常见的请求头
特殊的X-Requested-With

常见的请求头

在这里插入图片描述
有关注过爬虫的朋友应该会对http请求头比较熟悉
什么？不清楚
那我们百度百科一下
Accept：浏览器可接受的MIME类型。
Accept-Charset：浏览器可接受的字符集。
Accept-Encoding：浏览器能够进行解码的数据编码方式，比如gzip。Servlet能够向支持gzip的浏览器返回经gzip编码的HTML页面。许多情形下这可以减少5到10倍的下载时间。
Accept-Language：浏览器所希望的语言种类，当服务器能够提供一种以上的语言版本时要用到。
Authorization：授权信息，通常出现在对服务器发送的WWW-Authenticate头的应答中。
Connection：表示是否需要持久连接。如果Servlet看到这里的值为“Keep-Alive”，或者看到请求使用的是HTTP 1.1（HTTP 1.1默认进行持久连接），它就可以利用持久连接的优点，当页面包含多个元素时（例如Applet，图片），显著地减少下载所需要的时间。要实现这一点，Servlet需要在应答中发送一个Content-Length头，最简单的实现方法是：先把内容写入ByteArrayOutputStream，然后在正式写出内容之前计算它的大小。
Content-Length：表示请求消息正文的长度。
Cookie：这是最重要的请求头信息之一
From：请求发送者的email地址，由一些特殊的Web客户程序使用，浏览器不会用到它。
Host：初始URL中的主机和端口。
If-Modified-Since：只有当所请求的内容在指定的日期之后又经过修改才返回它，否则返回304“No