get和post请求
1. 学习get与post请求,尝试使用requests或者是urllib用get方法向百度一下,你就知道发出一个请求,并将其返回结果输出。
代码如下,会返回一个HTTP状态码200
2. 如果是断开了网络,再发出申请,结果又是什么。了解申请返回的状态码。
网络断开后出现连接错误。
raise ConnectionError(e, request=request)
requests.exceptions.ConnectionError: HTTPSConnectionPool(host='www.baidu.com', port=443): Max retries exceeded with url: / (Caused by NewConnectionError('<requests.packages.urllib3.connection.VerifiedHTTPSConnection object at 0x000001A077A43208>: Failed to establish a new connection: [Errno 11001] getaddrinfo failed',))
如下:
http状态码:当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含HTTP状态码的信息头(server header)用以响应浏览器的请求。
常见的状态码:
- 200 代表着你请求成功并返回数据了
- 404 notfound请求的资源(网页等)不存在
- 500 内*部服务器错误
3. 了解什么是请求头,如何添加请求头。
- 请求头是HTTP头部中传递一个字典参数给headers。
python爬虫中常见请求头有:User_Agent,Host等
例如:请求csdn时一个请求头