
爬虫-python
荆棘谷三季稻
这个作者很懒,什么都没留下…
展开
-
爬虫-python(二)初识urllib.request
继续写。上一篇写了最简单的一个爬虫,这次我们改下url地址,换成糗百,修改完的代码如下:from urllib.request import urlopen# 发送请求,获取服务器给的响应url = "https://www.qiushibaike.com/"response = urlopen(url)# 读取结果,无法正常显示中文html = response.read()# 进行解码操作,转为utf-8html_decode = html.decode()# 打印结果p原创 2021-01-25 16:54:19 · 280 阅读 · 0 评论 -
爬虫-python(三) 百度搜索关键词后爬取搜索结果
9点49,老婆孩子都睡着了, 继续搞。第1篇写了访问百度并打印页面源码,似乎没什么实际意义,这次弄个有点用的,就是百度中输入指定关键词后搜索,然后获取搜索结果第一页(翻页后面会陆续写)。比如我们输入‘博客园’,下面是查询结果(为啥写博客园不写优快云呢,因为最早是博客是在博客园里写的,现在自己转发到优快云,不改了):这个时候我们看下浏览器中url地址 ,大概是这个样子的好老长,我们去除掉一些看不懂的部分,只保留ie 和wd 这2个参数试下能否正常访问可以的访问,现在我们把这个url复制到 代原创 2021-01-24 10:51:15 · 7108 阅读 · 1 评论