python词频统计_用Python实现一个词频统计(词云+图)

本文介绍了如何使用Python进行词频统计,并通过词云库`wordcloud`生成词云图。首先确保安装了Python及相关库,然后对文本进行预处理、分词、去除停用词,接着统计词频并展示前10高频词,最后利用背景图片生成词云图。适合初学者了解Python文本处理和词云生成。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第一步:首先需要安装工具python

第二步:在电脑cmd后台下载安装如下工具:

L3Byb3h5L2h0dHBzL2ltZzIwMTguY25ibG9ncy5jb20vYmxvZy8xNjIyNDU4LzIwMTkwNC8xNjIyNDU4LTIwMTkwNDA0MTI0MzM4MjgzLTE0Njg2MjIwODQucG5n.jpg

(有一些是安装好python电脑自带有哦)

L3Byb3h5L2h0dHBzL2ltZzIwMTguY25ibG9ncy5jb20vYmxvZy8xNjIyNDU4LzIwMTkwNC8xNjIyNDU4LTIwMTkwNDA0MTI0ODQxOTk2LTExMjQyNDEyNjQucG5n.jpg

有一些会出现一种情况就是安装不了词云展示库

有下面解决方法,需看请复制链接查看:https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud

第三步:

1.准备好你打算统计的文件,命名为 家.txt,保存到桌面

2.准备一个做背景的图片,命名为girl.jpg,同样保存到桌面

第四步:插入代码

import re # 正则表达式库

import collections # 词频统计库

import numpy as np # numpy数据处理库

import jieba # 结巴分词

import wordcloud # 词云展示库

from PIL import Image # 图像处理库

import matplotlib.pyplot as plt # 图像展示库

# 读取文件

fn = open('C://Users//Thinkpad//Desktop//家.txt','rt') # 打开文件

string_data = fn.read() # 读出整个文件

fn.close() # 关闭文件

# 文本预处理

pattern =

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值