用Python爬取B站视频弹幕

本文介绍了如何使用Python获取B站视频的弹幕。通过分析视频URL找到 cid,然后请求弹幕XML文件,并将其保存到本地。详细步骤包括查找请求URL,发送请求,解析数据以及保存文件。

在这里插入图片描述

01找到请求的URL

我们平时在B站看视频时,弹幕是出现在视频上的,然而实际上,弹幕是存储在一个xml文件中的。我们想要找到弹幕,只需要找到这个xml文件即可。
例如:
https://comment.bilibili.com/139527441.xml
通过分析我们可以发现,每个视频弹幕的URL前半部分都是固定的,后半部分为一串数字,那么这串数字是什么呢?盲猜这一串数字和视频有关,可能是视频的编号。
其实,这一串数字就是视频的cid,到目前为止,我们已经分析出了要请求的URL。
https://comment.bilibili.com/视频cid.xml
那么如何查看一个视频的cid呢?
可以通过查看页面源代码的方式来找到视频的cid。
在这里插入图片描述

02发送请求并解析数据

在这里插入图片描述

03将弹幕文件保存到本地

在这里插入图片描述

评论 3
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值