- 博客(1)
- 收藏
- 关注
原创 基于Java学习视频弹幕的数据处理和分析
本文在这里主要使用的是正则来爬取弹幕,爬取代码放在文末并附带注释,关于文中正则表达式的疑惑可以自行谷歌。爬虫的基本步骤不再赘述,但这里涉及到多个视频的爬取,因此详细说一下爬取原理。视频一共有200p,在视频网址的response中我找到了每一个视频的cid和part值,其中part值很明显是视频标题,cid经过比对发现是与弹幕地址中的oid值匹配;因此,首先第一步我们先爬取到response中所有的cid与part值,并存入列表中;因为。
2024-03-21 15:12:47
1239
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人