爬虫练习题（二）

最新推荐文章于 2025-06-19 21:22:46 发布

原创

最新推荐文章于 2025-06-19 21:22:46 发布 · 705 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#python

本文介绍了如何使用Python的requests库，结合Referer头来反爬梨视频网站，提取视频ID，解析视频真实URL并下载视频。详细步骤包括分析网页结构，找到关键URL，构造请求并处理动态数据。最终实现视频文件的本地保存。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

博主链接：张立梵的爬虫开端

个人介绍：小编大一视传在读，目前即将大二

欢迎大家对文章 关注、点赞、收藏

最近小伙伴问我有什么刷题网站推荐，我在这里推荐一下牛客网，这里面包含各种题库，全都是免费的题库，可以全方面提升你的数据操纵逻辑，提升编程实战技巧，赶快来一起刷题吧牛客网笔试题库|面试经验

题目：利用referer防盗链参数反爬数据，以梨视屏为例

1.携带referer参数

2.把视屏下载保存到本地

打开视屏，抓他的包，要求要有referer防盗链的视屏

防盗链式记录从哪个地址跳转过来的？有些会携带，有些会不携带，服务器会根据这个检查，一旦核验，同样也会视为爬虫自动化程序，所以我们要携带这个参数

headers = {
	'referer':'https://www.pearvideo.com/video_1766981'
	'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.5060.114 Safari/537.36 Edg/103.0.1264.49'
}

只向 request url 发起请求，只会返回源代码，就是 HTML 文件，不是视频数据，一般音视频都在媒体，也就是 media 里，好看视频可以在，数据包里显示视频信息，她的 request url 对应的就是视频，点开就能打开，其实梨视频也是一样的

用字符串切片，并且可以以符号'_'分割，split 是分割，rsplit，也是分割方向是从右向左，这样可以把链接最后的数字拿下来，因为唯一变得一串数字是指定视频的位置，不同的数字串指定的是不同的视频，所以是个变量

以上海人的吃瓜自由奋斗史为例

https://xie.infoq.cn/link?target=https%3A%2F%2Fwww.pearvideo.com%2Fvideo_1763204

最低0.47元/天解锁文章

200万优质内容无限畅学