Python大作业——爬虫+可视化+数据分析+数据库（数据分析篇）

最新推荐文章于 2025-10-11 18:16:52 发布

原创

最新推荐文章于 2025-10-11 18:16:52 发布 · 709 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#android #前端 #后端

这篇博客详细介绍了Python数据分析项目的三个部分：生成歌词词云、绘制热门歌手歌曲量饼图以及创建歌曲热度占比的条形图。作者首先利用jieba进行歌词分词，然后展示了如何生成词云。接着，通过计算热门歌手歌曲量占比，制作了饼图。最后，分析了歌曲热度，生成了条形图，但由于数据限制，未完成歌手热门歌曲数量的柱状图分析。

个人博客

Python大作业——爬虫+可视化+数据分析+数据库（简介篇）

Python大作业——爬虫+可视化+数据分析+数据库（爬虫篇）

Python大作业——爬虫+可视化+数据分析+数据库（可视化篇）

Python大作业——爬虫+可视化+数据分析+数据库（数据库篇）

一、生成歌词词云

首先我们需要先获取所有爬取到的歌曲的歌词，将他们合成字符串

随后提取其中的中文，再合成字符串

text = re.findall('[一-龥]+', lyric, re.S)  # 提取中文
text = " ".join(text)

之后使用jieba进行分词，并将其中分出来的长度大于等于2的词保存

word = jieba.cut(text, cut_all=True)  # 分词
new_word = []
for i in word:
    if len(i) >= 2:
        new_word.append(i)  # 只添加长度大于2的词
final_text = " ".join(n