1.分析网页
视频地址: www.bilibili.com/video/BV19E… 本身博主同时也是一名up主,虽然已经断更好久了,但是不妨碍我爬取弹幕信息来分析呀。 这次我选取的是自己 唯一的爆款视频 。就是下面这个。
很多人学习python,不知道从何学起。
很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
很多已经做案例的人,却不知道如何去学习更加高深的知识。
那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!
QQ群:101677771

希望大家能够多多支持up,up在这里谢过大家了。 打开网址我们能够发现弹幕信息是存储在这一块的。

本来以为是可以直接爬到的,但是当我点开F12检查网页的时候却发现:

他很明显只加载了一部分的弹幕信息,那么怎么获取呢,别急下面有一个查看历史弹幕信息,我们点击一下试试看。


既然知道了信息是藏在哪里的,那么接下来就是简单分析一下他的 url地址的格式
了。

可以看到重点其实就在date上,只要更换date就能获

本文介绍了如何使用Python爬取B站视频的弹幕信息,结合jieba进行分词处理,并最终制作成词云。首先分析了网页结构,发现弹幕信息隐藏在特定的URL下。然后通过设置携带cookie的请求头爬取弹幕数据,并保存为CSV文件。接着使用jieba对弹幕内容进行分词,最后展示了词云的制作过程和成品效果。
最低0.47元/天 解锁文章

1201

被折叠的 条评论
为什么被折叠?



