python数据挖掘学习笔记】十三.WordCloud词云配置过程及词频分析

本文介绍如何使用Python生成词云,包括WordCloud库的基本配置、词频分析以及如何结合图片生成具有特定形状和颜色的词云。通过示例代码展示了从文本预处理到最终展示的完整流程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#2018-03-28 09:59:40 March Wednesday the 13 week, the 087 day SZ SSMR
11,12因为涉及到数据库被我暂时放弃了
python数据挖掘学习笔记】十三.WordCloud词云配置过程及词频分析 
四. 照片背景的词云代码


from os import path
from scipy.misc import imread  
import jieba
import sys
import matplotlib.pyplot as plt
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator  
filename = 'xingqiudazhan.txt'
# 打开本体TXT文件
#text = open(filename).read()
text = open(filename, encoding="utf8").read()

# 结巴分词 cut_all=True 设置为全模式 
wordlist = jieba.cut(text)     #cut_all = True

# 使用空格连接 进行中文分词
wl_space_split = " ".join(wordlist)


# #######读取mask/color图片
d = path.dirname(__file__)
liu_coloring = imread(path.join(d, "liu.jpg"))

#wordcloud = WordCloud(font_path = "simhei.ttf", background_color = "white", max_font_size = 80)		#设置字体属性

########### 对分词后的文本生成词云
my_wordcloud = WordCloud( background_color = 'white',      # 设置背景颜色
                            mask = liu_coloring,          # 设置背景图片
                            font_path = "simhei.ttf",		#没有这行就无法显示汉字
                            max_words = 2000,              # 设置最大现实的字数
                            stopwords = STOPWORDS,         # 设置停用词
                            max_font_size = 50,            # 设置字体最大值
                            random_state = 30,             # 设置有多少种随机生成状态,即有多少种配色方案
                            )

# generate word cloud 
my_wordcloud.generate(wl_space_split)

###### create coloring from image  
image_colors = ImageColorGenerator(liu_coloring)

######## recolor wordcloud and show  
my_wordcloud.recolor(color_func=image_colors)

plt.imshow(my_wordcloud)    # 显示词云图
plt.axis("off")             # 是否显示x轴、y轴下标
plt.show()

# save img  
my_wordcloud.to_file(path.join(d, "cloudimg.png"))



















评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值