
python爬虫
科大小笨
这个作者很懒,什么都没留下…
展开
-
python 爬虫基础(一):访问网页时候,总是报错404错误
python 爬虫访问网页时候,总是报错404错误> 如题,可能是因为没有增加header,网站认为你在非法攻击。可以用如下代码调试代码块语法遵循标准markdown代码,例如:import urllib2import jsonpathimport time# get city idrequest_city= urllib2.Request("http://www.xj.10086.cn/s原创 2017-08-31 01:35:40 · 9262 阅读 · 0 评论 -
python爬虫基础(二):HTTP协议总结
一、HTTP协议简介 1、HTTP协议(HyperText Transfer Protocol,超文本传输协议)是因特网上应用最为广泛的一种网络传输协议,所有的WWW文件都必须遵守这个标准。HTTP是一个基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)。 2、HTTP协议工作于客户端-服务端架构上。浏览器作为HTTP客户端通...原创 2019-07-03 18:19:07 · 407 阅读 · 0 评论