
Spider
仰望风
这个作者很懒,什么都没留下…
展开
-
爬虫基础知识
URL和URIURI的全称是Uniform Resource Identifier,即统一资源标识符URL的全称是Uniform Resource Locator,即统一资源定位符超文本超文本,英文名叫做hypertext,我们在浏览器中看到网页就是超文本解析而成的,网页源代码是一系列的HTML源码,浏览器解析里面的标签,形成了我们平常看到的网页,而网页的源代码HTML就是超文本HTT...转载 2019-01-02 23:16:34 · 198 阅读 · 0 评论 -
爬虫解析库使用
使用XPath原创 2019-01-12 17:19:36 · 384 阅读 · 0 评论 -
爬虫基本库的使用
使用urllib:request:他是最基本的HTTP请求模块,可以用来模拟发送请求,只需要给库方法传入URL以及额外的参数error:异常处理模块,如果出现请求错误,我们可以捕获异常,然后进行其他操作保证程序不会意外停止parse:工具模块,提供了很多URL处理方法,如拆分,解析,合并等发送请求urlopen()urllib.request模块提供了基本的工造HTTP请求的方法...转载 2019-01-09 17:41:21 · 373 阅读 · 0 评论