微信上有很多个群,不少群都是做了免打扰设置,但有的时候又想知道群里在讨论什么热点问题。利用词云图分析是一个了解某个微信群热点的方法。
本文通过itchat 采集微信群聊记录,用jieba做分词,用wordcloud生成词云图,主界面用wxPython完成。分析结果如下图:
对隐私内容马赛克处理了。
一、准备工作
首选,先要确定你的微信能登录微信网页版。只有能成功登录微信网页版,才能用 itchat 去分析群信息。
如果不能登录,只能借用其他的微信号进行研究了。
接下来配置好开发环境,安装相关库。
Python 3.7.3
itchat 1.3.10
jieba 0.42.1
Pypubsub 4.0.3
wordcloud 1.6.0
wxPython 4.0.6
二、过程:
1、创建数据表
import SqliteLib as sl
db = sl.WorkDb('db.db')
# 建立数据表 微信群表
sql_str = '''
create table wxq(id integer primary key autoincrement
, wxq_name string unique
, wxq_uid string
, wxq_time string
)
'''
db.run_sql(sql_str)
# 建立数据表 微信