5 文本主题与分类之词云图 --- 机器学习 --- 小白

本文介绍了如何使用Python进行词云图的绘制,包括导入库、读取文本、分词、清除停用词、计算词频以及两种不同的词云图生成方法。还提供了遇到的问题及其解决方案,并给出了参考资料。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

作者:Irain
QQ:2573396010
微信:18802080892
百度云盘文件:链接:https://pan.baidu.com/s/1Ym_1iLYSzTIZ-ajNFad_kA
提取码:hlyo)
视频链接:文本主题与分类之词云图

词云图

在这里插入图片描述
在这里插入图片描述

直接上代码并分析

1 导入库

#coding:utf-8
__author__ = 'Hanxiaoyang'

import warnings
warnings.filterwarnings("ignore")
import jieba    #分词包
import numpy    #numpy计算包
import codecs   #codecs提供的open方法来指定打开的文件的语言编码,它会在读取的时候自动转换为内部unicode 
import pandas as pd  
import matplotlib.pyplot as plt
%matplotlib inline
import matplotlib
matplotlib.rcParams['figure.figsize'] = (10.0, 5.0)
# from wordcloud import WordCloud#词云包
from wordcloud.wordcloud import WordCloud#词云包

2 读取文本并分词

df = pd.read_csv("./data/entertainment_news.csv", encoding='utf-8')  # 读取数据
df = df.dropna()  #  清除存在空值的数据
content=df.content
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值