
爬虫
Blijiojiodibuliduo
学习笔记
展开
-
Requests使用
Requests: 让 HTTP 服务人类 相比urllib Requests 自称 “HTTP for Humans”,使用更简洁方便。 Requests 继承了urllib的所有特性。Requests支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动确定响应内容的编码,支持国际化的 URL 和 POST 数据自动编码。 requests 的底层实现其实就是 u...原创 2019-09-20 17:34:59 · 142 阅读 · 0 评论 -
数据提取--JSON
基础知识 数据提取 什么是数据提取 简单来说,数据提取就是从响应中获取我们需要的数据的过程 数据分类 结构化数据处理方式 文本、电话号码、邮箱地址:正则表达 html:正则表达式、XPath 非结构化数据 JSON 文件:JSON Path、转化成Python类型进行操作(json类) XML 文件:转化成Python类型(xmltodict)、XPath、CSS选择器、正则表...原创 2019-09-29 20:46:50 · 393 阅读 · 0 评论