作者:Irain
QQ:2573396010
微信:18802080892
百度云盘文件:链接:https://pan.baidu.com/s/1Ym_1iLYSzTIZ-ajNFad_kA
提取码:hlyo)
视频链接:文本主题与分类之词云图
词云图
直接上代码并分析
1 导入库
#coding:utf-8
__author__ = 'Hanxiaoyang'
import warnings
warnings.filterwarnings("ignore")
import jieba #分词包
import numpy #numpy计算包
import codecs #codecs提供的open方法来指定打开的文件的语言编码,它会在读取的时候自动转换为内部unicode
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import matplotlib
matplotlib.rcParams['figure.figsize'] = (10.0, 5.0)
# from wordcloud import WordCloud#词云包
from wordcloud.wordcloud import WordCloud#词云包
2 读取文本并分词
df = pd.read_csv("./data/entertainment_news.csv", encoding='utf-8') # 读取数据
df = df.dropna() # 清除存在空值的数据
content=df.content