表达微阵列分类的得分空间研究
1. 得分空间的计算与定义
在处理表达微阵列分类任务时,我们基于概率潜在语义分析(PLSA)模型来构建不同的得分空间。通过对PLSA模型参数 (p(z)) 和 (p(w|z)) 对式4求导,可以计算得分。具体公式如下:
(\frac{\partial l(d_i)}{\partial p(w_r|z_t)} = n(d_i, w_t) \cdot \frac{p(d_i|z_t) \cdot p(z_t)}{\sum_{k} p(w_r|z_k) \cdot p(d_i|z_k) \cdot p(z_k)}) (5)
(\frac{\partial l(d_i)}{\partial p(z_t)} = \sum_{j=1}^{W} n(d_i, w_j) \cdot \frac{p(d_i|z_t) \cdot p(w_j|z_t)}{\sum_{k} p(z_k) \cdot p(w_j|z_k) \cdot p(d_i|z_k)}) (6)
从式5 - 6可以看出,样本被映射到一个维度为 (W \times Z + Z) 的空间中。Fisher核被定义为该空间中的内积,我们将其记为FSH。
2. 不同得分空间介绍
- TOP核得分空间 :TOP核和后验对数赔率得分空间的切向量在相关研究中被引入。该研究旨在为得分空间引入一种性能度量,通过考虑逻辑回归器对后验概率的估计误差,推导出TOP核以最大化性能。与Fisher得分从边际对数似然计算不同,TOP核源自后验对数赔率的切向量。两个得分空间具有相同的得分函数(即梯度),但得分参数不同,对于TOP核 (f(p(x
超级会员免费看
订阅专栏 解锁全文
19

被折叠的 条评论
为什么被折叠?



