Python大作业——爬虫+可视化+数据分析+数据库(简介篇)
Python大作业——爬虫+可视化+数据分析+数据库(爬虫篇)
Python大作业——爬虫+可视化+数据分析+数据库(可视化篇)
Python大作业——爬虫+可视化+数据分析+数据库(数据库篇)
一、生成歌词词云
首先我们需要先获取所有爬取到的歌曲的歌词,将他们合成字符串
随后提取其中的中文,再合成字符串
text = re.findall('[一-龥]+', lyric, re.S) # 提取中文
text = " ".join(text)
之后使用jieba进行分词,并将其中分出来的长度大于等于2的词保存
word = jieba.cut(text, cut_all=True) # 分词
new_word = []
for i in word:
if len(i) >= 2:
new_word.append(i) # 只添加长度大于2的词
final_text = " ".join(n

这篇博客详细介绍了Python数据分析项目的三个部分:生成歌词词云、绘制热门歌手歌曲量饼图以及创建歌曲热度占比的条形图。作者首先利用jieba进行歌词分词,然后展示了如何生成词云。接着,通过计算热门歌手歌曲量占比,制作了饼图。最后,分析了歌曲热度,生成了条形图,但由于数据限制,未完成歌手热门歌曲数量的柱状图分析。
最低0.47元/天 解锁文章
384





