【python笔记】关于LDA可视化的参数lambda

论文做到了LDA可视化

放一张效果图叭

在这里插入图片描述主要讲讲右上角那个参数

在pyLDAvis可视化结果中,右上角的参数是指lambda值。这个参数控制着文档中的词语权重和主题词语权重之间的比例。当lambda值趋近于0时,只有主题词语权重被考虑,而当lambda值趋近于1时,只有文档中的词语权重被考虑。因此,选择合适的lambda值可以使得可视化结果更加符合实际情况。默认情况下,lambda值为0.6。用户可以通过滑动滑块来调整lambda值,以获得最佳的可视化效果。

在pyLDAvis中,lambda值是通过pyLDAvis.prepare()函数中的mds参数进行控制的。具体来说,mds参数是一个包含以下四个元素的列表:

X:文档-主题分布矩阵,每行代表一个文档,每列代表一个主题。
tdm:文档-词语矩阵,每行代表一个文档,每列代表一个词语。
vocab:词汇表,即所有词语的列表。
doc_lengths:每个文档包含的词语数量的列表。

在mds参数中,lambda值可以通过将X矩阵中每一列的值与tdm矩阵中每一行的值加权平均来计算得到。具体来说,计算过程如下:

def _job(X
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值