1.目标网站
本次爬取网站:https://www.netcarshow.com/
所有图片全部为1024*748高清图片,数据可用于自行处理分析。
以下只进行网站的分析,没有代码的实现。(好长时间没做了,现在网站确实或多或少都有反爬措施了)
2.爬取分析
第一步
进入网站https://www.netcarshow.com/后进行分析发现,所有图片全都存储在
而另一部分
只是展示了最近几天的,汽车图片,而不是所有的图片。(所以各取所需)
以下只分析全部图片的url!
对url右键检查发现 li 标签下都是残缺的url,
然后进行右键查看网页源码,发现这下li标签都在源码里面,那就好办了!
把href标签里面的数据匹配下来,只需要简单的url拼接即可得到:例如(https://www.netcarshow.com/lucid/ )
点击进去网页https://www.netcarshow.com/lucid/ ,在进行右键检查,即可发现又是url拼接才可!