- 博客(2)
- 收藏
- 关注
原创 关于PLSA的一个参数公式的解释
看PLSA的论文,一开始就蹦出两个公式,涉及到参数P(w|d):第一个公式还没什么,第二个就没法直接推出来了,直接推得到的结果是:那么为什么会变成第二个公式呢?原因在于:引入表示topic的z后,我们就假设w与d是相互独立的,即:P(d,w)=P(d)*P(w),P(w|d)=P(w),P(w|z,d)=P(w|z)。于是第二、三个公式就等价了。
2015-08-27 16:08:33
455
原创 关于熵的数学基础
第一次写博客,呵呵。在看自然语言处理的一个课件里关于“熵”一部分,本文记录一些基本公式和一些自己的理解。部分文字和公式的图片是直接从ppt中拿下来的,侵删。什么是熵?课件里的原话:熵又称为自信息(self-information),表示信 源 X 每发一个符号(不论发什么符号)所提供的 平均信息量。熵也可以被视为描述一个随机变 量的不确定性的数量。一个随机变量的熵越大, 它的不
2015-07-24 14:28:39
2292
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人