
爬虫
记录我从零开始学爬虫的历程
魔童a
这个作者很懒,什么都没留下…
展开
-
爬虫初探(二)爬取动态网页照片存入本地
前言 本人初学爬虫练习写的爬虫代码,如有什么问题和建议,欢迎留言交流! 一、什么是动态网页? 静态网页:存粹的HTML格式的网页,没有后台数据库 、不含程序和不可交互的网页; 动态网页:与静态网页相对的,可以跟后台数据库进行交互、数据传递。 最后,不要将动态网页跟页面是否有动感混为一谈,重点在于网页是否采用了动态网页技术,是否可以交互。 二、具体步骤 1. 如何爬取动态网页上的数据 对于静态网页,使用requests等库可以很方便的得到它的网页源码,然后提取出想要的信息。但是对于动态网页,情况就原创 2020-12-16 15:15:56 · 621 阅读 · 0 评论 -
爬虫初探(一)爬取静态网页图片存入本地
前言 刚开始学习爬虫,如有什么问题和建议,欢迎留言交流 一、使用requests库爬取静态网页 使用requests的get方法爬取静态网页中的照片,保存到本地问价夹(我这里是D:\BeautifulPicture),其中有使用BeautifulSoup帮助我们挑选出指定的标签。 二、具体步骤 1.获得html信息,进行分析 任意选择自己想爬取的页面(注意要是静态页面,动态也页面下一篇再具体写) 我这里爬取的页面url:https://mbd.baidu.com/newspage/data/la原创 2020-12-15 18:32:41 · 1603 阅读 · 1 评论