今天有点闲,想着爬取一下哔哩哔哩的视频练练手.
说干就干!打开B站,搜索"鸡你太美",大叔就是这么潮流,哈哈.废话不多说,吭哧吭哧开始肝.
F12—>Network—>一无所获.
在我的理解中,视频应该有个访问连接的呀,而且放在json格式的文件中,这样我们直接访问资源URL就可以下载到视频了呀.
然而,并没有.
接下里就是长达四五个小时的文献参考以及试错.
在网上看到的都是从up主个人主页里下载视频的,和我的预期有些不符,所以我们就先看前辈们的资料吧.
我们来到一个up主的个人中心,开始吭哧吭哧.
这里,我用了fiddler,太难了…

没错,就是这个"点击倾听,他们与B站的故事!"我怎么都没找到他在网页的布局.这里先挖个坑.
然后接着吭哧吭哧,找我们的视频URL

接着我就找到了这个,但是,里面并没有视频连接,只有title以及一些图片的URL.到这里,我就有点慌了,因为这里已经超出我的估计了.一般思维,我们视频对应的部分应该就有视频URL了啊.怀着忐忑的心情,我继续向下找了几个文件,果不其然一无所获.
这中间发生了一件诡异的事情,B站拒绝我的访问,然后刷新了一下又好了.
仔细对比,发下那个资料是很久之前的了…但是讲道理,视频访问的URL应该大差不差呀,可惜,没能弄明白.
算了,靠自己吧!吭哧吭哧
发现json中有一个play=2753的字段,这个可能就是视频的编号了.,突然又看见一个aid的字段,好吧,你猜会是哪个,当然是aid了.还有一个created和mid字段,mid应该是作者的编号,那么其他两个的编号是什么含义呢?后面还有bvid, cid,我已当场凌乱.视频访问URL快点出来吧!虽然可能并不会有.
接下来就是找视频URL是怎么拼接的了.
搜搜查查,果然是没有视频请求的URL,那么接下来该怎么办?
找了半天也只找到视频的这些数据,不过确定了aid是视频的编号.bvid应该是被加密处理了.
今天就先到这里吧,心态崩了,再去查查资料!
Python爬取B站视频
最新推荐文章于 2025-12-06 11:33:28 发布
本文记录了尝试爬取B站视频的过程,从搜索视频到分析网页源码,发现并未直接提供视频URL。通过Fiddler等工具深入挖掘,发现视频编号,但实际视频URL加密处理,使爬取变得复杂。故事以查找加密解密方法告一段落,展示了网络爬虫面对加密数据的挑战。
Python3.8
Conda
Python
Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本
您可能感兴趣的与本文相关的镜像
Python3.8
Conda
Python
Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

756

被折叠的 条评论
为什么被折叠?



