python爬取动态页面

Go~Go~Go~

于 2021-12-05 23:14:03 发布

阅读量4.9k

点赞数 1

CC 4.0 BY-SA版权

文章标签： python 开发语言后端

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/js010111/article/details/121737611

python 专栏收录该内容

13 篇文章

订阅专栏

一、动态页面

概述：在页面中执行某些动作，如翻页、点击等，页面的url不变，对这种类型的页面爬取。
原理：动态页面的数据的获取主要有两种（就我目前了解到的），

（1）网页先将数据请求放在某个<script></script>中，分页展示；

（2）页面通过ajax请求获取数据。

二、方法

如何判断是哪种？

（1）打开控制台的网络部分，：
$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RivKJ3PT-1638716999333)(D:\大学\项目\NFT\学习文档\img\img2)]$

（2）再次触发事件，比如说点击下一页，观察是否接收新的数据包

在这里插入图片描述

（3）出现的话就是原理的第二种方式，查看数据包的详细信息：

在这里插入图片描述

（4）打开请求标头的url，访问url就可以进入数据页面，按照常规的爬取方式爬取就行，可以根据它的响应头设置相关的参数反爬。可以根据该url的结构爬取多个事件的数据。

（5）如果（2）中没有接收到新的网络包，证明是原理（1）的方式，在页面中找到数据所在的<script></script>标签解析即可。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。