崔庆才《Python3网络爬虫开发实战教程》的学习笔记系列 第一章 基本库的使用
1 python3的urllib库包含4个模块
request模块:
用于模块发送HTTP请求;
error模块:
异常处理模块,主要用于保证程序不会意外中断;
parse模块:
工具模块,包含了url处理方法;
robotparse模块:
用于识别网站的robots.xml文件,验证哪些网站不能爬取;
2 request模块
2.1 发送请求
...
原创
2018-08-25 09:18:45 ·
2099 阅读 ·
0 评论