2020.4.5:jieba和wordcloud统计聊天信息

本文介绍了如何通过jieba分词和wordcloud生成微信聊天记录的词云图。采用人工方法抓取聊天记录,注意背景需为白色,并确保在wordcloud中用空格连接jieba分词后的list对象。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

微信聊天记录网上教程比较复杂,没有实现,经过询问同学,主要采取人工的方法,将和某人的聊天记录暴力抓取。(ctrl+c ==> ctrl+v)

代码实现

import jieba
import wordcloud
from scipy.misc import imread

with open('chat.txt', 'r', encoding='utf-8') as f:
	text = f.read()

fig_path = './heart.png'     # 背景图片
out_path = './res.png'       # 输出图片的路径
font_path = './msyhbd.ttc'   # 字体存储的路径,可从系统字体复制

def plot_data(text, fig_path=fig_path, font_path=font_path, words=20):
	wc = wordcloud.WordCloud(background_color='white',
				 width=1000, height=800,
				 font_path=font_path,
				 mask=imread(fig_path),
				 max_words=words
				 )
	wc.generate(' '.join(text)) #必须用空格
	wc.to_file(out_path)

	return None

plot_data(text)

注意事项

  • 背景图片选用白底;(一定白色)
  • wordcloud是根据空格进行统计文字的个数,所以jieba库进行分词以后得到的是一个list对象,一定要用空格填充list对象,返回一个str。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值