今天,我们用python来开发一个简陋的图片搜索下载器。
由于网站使用javascript和ajax动态加载技术,还有验证码机制,对小白来说想要获得原图实在太难啦。
所以能获取缩略图,主要提供基本思路。
选择的是pixabay,挺有名的高品质图片网站,免费的, 相信许多人对此并不陌生。
一、目标:
1、实现输入关键词,自动搜索到图片
2、获取图片链接
3、批量下载图片,命名保存入文件
4、代码优化,不中段、无重复,并且可指定下载范围
二、步骤:
1、首先观察分析。
点击进入官网,好家伙和百度一样的瀑布流模式,查看源码发现关键字‘ajax',及异步加载模式
果不其然,要点击页面才能看到缩略图,还要点击图片才能下载。审查元素里面并不是原图的链接,源码中也没有,点开图片后还有上方的地址也并不是原图地址,按照一般的思路的话,并不能获取原图(可能要用到PhantomJS、Selenium等)。可是我还没有学到PhantonJ和Selenium呀,所以只能先试试缩略图啦。(不过最小的那一个下载模式要大一些)/2013/10/16/14/45/是时间,flower为关键词,结合源码分析196360应该是每一个图片的特殊代号。