前言:当爬虫爬取多页时,大部分网站都是有下一页,或者标记有总页数,这让我们可以通过查找下一页的标签获取下一页的内容,又或者得到总页数,直接for循环url遍历所有页的内容,这两种都可以得到你想爬取多页的信息。
那么碰到动态加载的网页,或者点击出现,又或者滑动滚动条加载数据,这种网页的话就需要用其他的方法找数据了
1 解析JSON(好用,难度较大)
2使用selenium 实现点击及滑动滚动条加载数据!
3 。。。。
这次我们使用selenium爬取豆瓣高评分电影,通过点击实现加载数据!
1,打开要爬取的网站
通过-->选电影-->豆瓣高分 得到想要的网页