python爬取B站视频中的弹幕并图形化展示
新手上路,参考:https://blog.youkuaiyun.com/csdnnews/article/details/106754771案例
需要了解爬取的地址:
1:视频地址:https://www.bilibili.com/video/BV1PK4y1b7dt?t=1
2.对于参考文档中提到的B站API接口,是如何找到的,不是很清楚,故只能照搬过来:https://api.bilibili.com/x/v1/dm/list.so?oid=XXX,其中XXX需要在网页中获取
3.oid=XXX中的XXX获取:
获取cid:https://api.bilibili.com/x/player/pagelist?bvid=BV1PK4y1b7dt&jsonp=json
此处的cid,即所需XXX,如果视频是分段的,则会有多个cid值,这里只有一个
故完整的接口为:https://api.bilibili.com/x/v1/dm/list.so?oid=201056987
代码:我这是分两部分,爬取弹幕保存本地,本地读取构成词云图
本地爬取:
import requests
import json
import re
import chardet #提供自动检测字符编码的功能
from pprint import pprint #打印出任何pyth