
Python爬虫
文章平均质量分 92
Python数据爬取相关知识
愿美梦成真
这个作者很懒,什么都没留下…
展开
-
爬虫学习3——正则表达式
文章目录1. 正则表达式的简介1.1 概念1.2 正则表达式的应用场景2. 正则表达式对Python的支持2.1 普通字符2.2 元字符2.3 预定义匹配字符集2.4 重复匹配 1. 正则表达式的简介 1.1 概念 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑 1.2 正则表达式的应用场景 表单验证(例如:手机号、邮箱、身份证…) 爬虫 2. 正则表达式对Python的支持 2.1原创 2021-02-14 10:29:37 · 90 阅读 · 0 评论 -
爬虫学习2——爬虫请求模块
文章目录1. urllib.request模块1.1 版本1.2 常用的方法1.3 响应对象2. urllib.parse模块2.1 常用方法3. 请求方式4. requests模块4.1 安装4.2 request常用方法4.3 响应对象response的⽅法4.4 requests模块发送 POST请求4.5 requests设置代理4.6 cookie4.7 session4.8 处理不信任的SSL证书5. requests 模块源码分析 1. urllib.request模块 1.1 版本 pyt原创 2021-02-02 23:36:20 · 131 阅读 · 0 评论 -
爬虫学习1——爬虫简介
1. 通讯协议 1.1 端口 我们想要进⾏数据通讯分⼏步? 找到对⽅ip 数据要发送到对⽅指定的应⽤程序上。为了标识这些应⽤程序,所以给这些⽹络应⽤程序都⽤数字进⾏了标识。为了⽅便称呼这个数字,叫做端⼝。这⾥的端⼝我们⼀般都叫做 ‘逻辑端⼝’ 定义通讯规则。这个通讯规则我们⼀般称之为协议 1.2 通讯协议 国际组织定义了通⽤的通信协议 TCP/IP协议 所谓协议就是指计算机通信⽹络中两台计算机之间进⾏通信所必须共同遵守的规定或规则 HTTP⼜叫做超⽂本传输协议(是⼀种通信协议) HTTP 它的端⼝是原创 2021-02-02 15:48:31 · 160 阅读 · 0 评论