1.说明
因为https://desk.zol.com.cn/fengjing/恰好为静态网页,requests返回的东西有我们想要的东西,所以用最基础的正则表达式来爬取图片并保存。
2.分析html
我们要提取图片的名称,图片链接,图片的上映日期。
我们可以发现,每个图片的信息都在<li class="photo-list-padding">
开头的标签节点内,我们可以根据这个开头,中间多余部分用.*?
抓取,要爬取的部分用(.*?)
来抓取
<li class="photo-list-padding">
<a class="pic" href="/bizhi/9611_116395_2.html" target="_blank" onclick="zol_niux_tongji('desk_list_firstpic')" hidefocus="