一、操作步骤
爬虫不仅能抓到网页上的文本、网址数据,还可以批量下载图片到电脑中。无论是列表页还是详情页上的图片,只要能获取图片网址都可以用爬虫来下载图片。下面就以途牛网的自助游网页为案例,操作步骤如下:
**注意事项:**从爬虫软件V9.0.0开始,图片下载后的存储位置有了很大改变,但是定义规则过程不变,请注意看第五步里面的说明和相应的链接。
二、案例规则+操作步骤
- 样本网址:http://www.tuniu.com/tours/210299425
- 采集内容:旅游名称、价格、图片网址。
如果纯粹采集图片,就不知道图片来源于哪里,所以,我们通常会把网页上的文本信息“旅游名称”“价格”也采集下来,最后可以用excel把它们匹配起来。文章《采集网页数据》已经详细讲过前两步操作了,下面就从第三步操作开始讲。
第三步:采集图片网址
3.1,