
python爬虫
《Python3网络爬虫开发实战》的读书笔记。
七月的summer
这个作者很懒,什么都没留下…
展开
-
三、正则表达式的基本用法
正则表达式 正则表达式是用一定的规则将特定的文本提取初来,是处理字符串的强大工具。 开源中国提供的正则表达式测试工具 常用的匹配规则 一.match() 向match()传入要匹配的字符串以及正则表达式,就可以检测这个正则表达式是否匹配字符串。 match()方法默认从字符串的起始位置匹配正则表达式,如果匹配,就返回匹配的结果,否则就返回None。 第一个参数是正则表达式,第二个参数是要匹配的字符串。 import re content='Hello 123 4567 World_This is a Re原创 2020-06-23 21:53:33 · 559 阅读 · 0 评论 -
二、基本库之requests
基本库之requests urllib库中的urlopen()实际上是以GET方法请求网页,而requests中相应的方法就是get()方法。 import requests r=requests.get('https://www.baidu.com/') print(type(r)) print(r.status_code) print(type(r.text)) print(r.text) print(r.cookies) r=requests.post('url') r=requests.put('原创 2020-06-22 21:45:03 · 936 阅读 · 0 评论 -
一、urllib库的基本用法-四个模块
urllib库相关 urllib库常用有四个模块,常用前三个 urllib.request urllib.error urllib.parse urllib.robotparser 一.urllib.request 1.urlopen() urllib.request.urlopen(url,data=None,[timeout,]*,cafile=None,capath=None,cadefault=False,context=None) data:附加数据,如果传递了这个参数,它的请求方式就不再是GET原创 2020-06-21 00:00:04 · 3002 阅读 · 0 评论