WordCloud的使用方法

这段代码展示了如何利用jieba分词和WordCloud库对文本进行处理和可视化。首先,通过pickle加载章节内容,然后读取停用词列表,使用jieba进行文本分词并过滤掉停用词。接着,将处理后的字符串传递给WordCloud生成词云,并指定背景图片。最终,展示词云图,其中的词频反映了文本中各词汇的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.安装WordCloud

pip install wordcloud

2.导入

import pickle
import jieba
import pandas as pd
import wordcloud
import matplotlib.pyplot as plt
from imageio import imread
#%%
#读取chapter


pickle_file = open(r'C:\Users\yandi\PycharmProjects\MachineLearing\LearningTest01\SDTest\chapter.pkl','rb')
chapter = pickle.load(pickle_file)
pickle_file.close()

#%%
#读取停用词
stoplist = list(pd.read_csv(r'C:\Users\yandi\PycharmProjects\MachineLearing\LearningTest01\停用词.txt',
                            names=['w'],sep='aaa',encoding='UTF-8',engine='python').w)

def m_cut(intxt):
    return [w for w in jieba.cut(intxt) if w not in stoplist and len(w) > 1]

ls = " ".join(m_cut(chapter.txt[1]))
#%%
cloudobj = wordcloud.WordCloud(mask=imread(r'C:\Users\yandi\PycharmProjects\MachineLearing\LearningTest01\射雕背景0.jpg'),
                               mode='RGBA',background_color=None
                               ).generate(ls)
#%%
plt.imshow(cloudobj)
plt.axis('off')
plt.show()
  1. ls是字符串,但是传到WordCloud里面必须是用空格间隔的
  2. mask是指定背景图片
  3. 指定图片的色系
### echarts-wordcloud 使用方法 #### 安装依赖包 为了使用 `echarts-wordcloud` 插件,需先安装对应的 npm 包。对于 echarts 5.x 版本及以上,推荐安装特定版本的 `echarts-wordcloud`: ```bash npm install echarts-wordcloud@2 ``` 此命令会下载适用于当前项目的词云插件及其依赖项[^1]。 #### 基础配置初始化 引入必要的 JavaScript 文件之后,在 HTML 页面中创建一个容器来容纳图表,并设置其样式属性以便于显示效果更佳。接着利用 JavaScript 初始化 ECharts 实例对象并注册 wordCloud 图表类型。 ```html <!-- 引入Echarts核心 --> <script src="https://cdn.jsdelivr.net/npm/echarts/dist/echarts.min.js"></script> <!-- 引入wordcloud扩展 --> <script src="https://cdn.jsdelivr.net/npm/echarts-wordcloud/dist/echarts-wordcloud.min.js"></script> <div id="main" style="width: 600px;height:400px;"></div> <script type="text/javascript"> var chartDom = document.getElementById('main'); var myChart = echarts.init(chartDom); // 注册wordcloud类型的图表 echarts.registerMap('world', worldGeoData); // 如果有地图需求则加载对应的地图文件 option = { series : [ { name:'词频统计', type:'wordCloud', gridSize: 2, sizeRange: [12, 60], rotationRange: [-90, 90], shape: 'circle', textStyle: { normal: { color: function () { return 'rgb(' + [ Math.round(Math.random() * 160), Math.round(Math.random() * 160), Math.round(Math.random() * 160) ].join(',') + ')'; } }, emphasis: { shadowBlur: 10, shadowColor: '#333' } }, data:[ {name: 'Sam S Club', value: 87}, {name: 'Macys', value: 76}, ... ] } ] }; myChart.setOption(option); </script> ``` 上述代码片段展示了如何定义基本参数以构建简单的词云图实例,其中包含了对文字尺寸范围(`sizeRange`)、旋转角度区间(`rotationRange`)等特性的设定;同时也指定了数据源数组内的若干条目作为实际要渲染的文字内容[^2]。 #### Vue 组件集成方案 当开发者希望在基于Vue框架的应用程序里快速部署该组件时,则可以考虑采用已有的封装好的 vue-echarts 组件形式来进行操作。只需要向父级组件传递好准备完毕的数据结构体(即 options),就能轻松实现在页面上呈现动态更新的词云视图了[^4]。 ```javascript import ECharts from "vue-echarts"; // 或者如果你正在使用 Webpack 并且已经全局导入了 ECharts 和 WordCloud 扩展的话可以直接这样写: // import "echarts"; export default { components: { vChart: ECharts }, data() { return { chartOptions: {...} // 同样遵循上面提到的标准option格式 }; } }; ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值