post 爬虫request_requests 爬虫系列总结

本文详细解读了HTTP头部中的重要字段,如Accept、Charset、Encoding、Language等,展示了客户端与服务器之间的请求和响应过程,帮助理解HTTP协议的工作原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Header 解释 示例

Accept 指定客户端能够接收的内容类型 Accept:text/plain,text/html

Accept-Charset 浏览器可以接受的字符编码集。 Accept-Charset:iso-8859-5

Accept-Encoding 指定浏览器可以支持的web服务器返回内容压缩编码类型。 Accept-Encoding:compress,gzip

Accept-Language 浏览器可接受的语言 Accept-Language:en,zh

Accept-Ranges 可以请求网页实体的一个或者多个子范围字段 Accept-Ranges:bytes

Authorization HTTP授权的授权证书 Authorization:Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==

Cache-Control 指定请求和响应遵循的缓存机制 Cache-Control:no-cache

Connection 表示是否需要持久连接。(HTTP 1.1默认进行持久连接) Connection:close

Cookie HTTP请求发送时,会把保存在该请求域名下的所有cookie值一起发送给web服务器。 Cookie:$Version=1;Skin=new;

Content-Length 请求的内容长度 Content-Length:348

Content-Type 请求的与实体对应的MIME信息 Content-Type:application/x-www-form-urlencoded

Date 请求发送的日期和时间 Date:Tue,15 Nov 2010 08:12:31 GMT

Expect 请求的特定的服务器行为 Expect:100-continue

From 发出请求的用户的Email From:user@email.com

Host 指定请求的服务器的域名和端口号 Host:www.zcmhi.com

If-Match 只有请求内容与实体相匹配才有效 If-Match:“737060cd8c284d8af7ad3082f209582d”

If-Modified-Since 如果请求的部分在指定时间之后被修改则请求成功,未被修改则返回304代码 If-Modified-Since:Sat,29 Oct 2010 19:43:31 GMT

If-None-Match 如果内容未改变返回304代码,参数为服务器先前发送的Etag,与服务器回应的Etag比较判断是否改变 If-None-Match:“737060cd8c284d8af7ad3082f209582d”

If-Range 如果实体未改变,服务器发送客户端丢失的部分,否则发送整个实体。参数也为Etag If-Range:“737060cd8c284d8af7ad3082f209582d”

If-Unmodified-Since 只在实体在指定时间之后未被修改才请求成功 If-Unmodified-Since:Sat,29 Oct 2010 19:43:31 GMT

Max-Forwards 限制信息通过代理和网关传送的时间 Max-Forwards:10

Pragma 用来包含实现特定的指令 Pragma:no-cache

Proxy-Authorization 连接到代理的授权证书 Proxy-Authorization:Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==

Range 只请求实体的一部分,指定范围 Range:bytes=500-999

Referer 先前网页的地址,当前请求网页紧随其后,即来路 Referer:http:

TE 客户端愿意接受的传输编码,并通知服务器接受接受尾加头信息 TE:trailers,deflate;q=0.5

Upgrade 向服务器指定某种传输协议以便服务器进行转换(如果支持) Upgrade:HTTP/2.0,SHTTP/1.3,IRC/6.9,RTA/x11

User-Agent User-Agent的内容包含发出请求的用户信息 User-Agent:Mozilla/5.0(Linux;X11)

Via 通知中间网关或代理服务器地址,通信协议 Via:1.0 fred,1.1 nowhere.com(Apache/1.1)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值