0127（http+request）

最新推荐文章于 2025-12-17 20:00:56 发布

原创最新推荐文章于 2025-12-17 20:00:56 发布 · 326 阅读

CC 4.0 BY-SA版权

文章标签：

爬虫的流程:

获取网页内容→解析网页内容→储存和分析数据

组成部分:请求行，请求头，请求体

请求行中包含：

方法类型，资源路径，协议版本

请求头：

中存放的是服务端能接受的信息

请求体：

请求体中发送给服务器的数据

状态行→响应头→响应体

状态行：

协议版本，状态码，状态消息

今天记忆几个：

100（Continue) 继续。客户端应继续其请求

101（Switching Protocols）切换协议（切换到更高的http协议）

200（OK）请求成功一般用于get和post请求

202（created）已创建。成功并创建了新的资源

300 （multiple choices）多种选择。请求的资源可以包括多个位置，响应可返回一个资源特征与地址的列表用于浏览器的选择。

301 （move permanently）永久移动。请求的资源被移动到新的URL里

400（bad request）客户端请求的语法错误，服务器无法理解

401（unauthorized）请求要求用户的身份认证

500（internal server error）服务器内部错误，无法完成请求

501（not implemented）服务器不支持请求的功能，无法完成请求。