最近在研究使用python写网络爬虫,需要用到一些HTTP的状态码,先记下来,以备不时之需。
HTTP状态码 | 描述 | 处理方式 |
---|---|---|
100-204 | 为正确状态码 | 继续 |
300+ | 一般为重定向状态码,python中的urllib2模块会自动处理 | 继续 |
400 | 非法请求 | 丢弃 |
401 | 未授权 | 丢弃 |
403 | 禁止 | 丢弃 |
404 | 没有找到资源 | 丢弃 |
500 | 服务器内部错误,一般出现在服务器端的源代码 | |
501 | 服务器无法识别,服务器不支持当前请求所需要的某个功能 | |
502 | 错误网关 | 丢弃 |
503 | 服务器出错,由于临时的服务器维护或者过载,这个状态是临时的 |