# 研究杂感 × 改进文本共现分析 PMI-Gephi(第二辑)

写在前面

单纯用一个普通的Gephi逼格还不够高,继续尝试一下其进阶版——PMI-Gephi 进行改进文本共现分析

理论介绍

在这里插入图片描述
其中,分子是两个词语共同出现的概率,分母是两个词语分别出现的概率的乘积

在数学中,我们认为,理论上分子等于分母:
在这里插入图片描述
分子中的P(W1,W2) ,它指的是这两个词语在语料中的实际贡献概率
分母中的P(W1) 和 P(W2) ,它指的是两个词语实际出现的概率
在这里插入图片描述

W1 和 W2 的求法相同
在这里,“文档”是一个比较宽泛的概念,比如在我的毕设中即以一条评论作为一个文档

从理论上推导这两个词语共同出现的概率,也就是说分母相当于一个期望值分子是一个实际出现的概率

如果说比值大于1(即实际贡献率>期望值)—该词语的贡献更有意义—网络关系生成
如果说比值小于1(即实际贡献率期望值)—该词语的贡献意义不大—不会生成网络关系

然后其余的方法也是和之前的类似

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人生苦短我愛Python

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值