爬取B站弹幕做折线图
由于网站更新较快,仅供参考学习
pip install +“库名” (安装库)
# 1. 分析网页,找到弹幕所在网页位置;
# 2. 向网页发送请求,获取网页代码;
# 3. 解析网页,提取弹幕发布时间;
# 4. 将弹幕发布时间进行分段统计;
# 5. 绘制折线图。
import requests
from bs4 import BeautifulSoup
from pyecharts.charts import Line # 想要生成折线图
cid = "381898365"
url = f"https://comment.bilibili.com/{
cid}.xml"
response = requests.get(url)
# print(response.encoding) # 获取编码方式
# print(response.apparent_encoding) # .apparent_encoding 属性会从网页的内容中分析网页编码的方式。基于解析的编码不一定正确,作为备选方案
response.encoding = "utf-8"
xml = response.text
soup = BeautifulSoup(xml