分层判别分析在分层文本分类中的应用
在文本分类领域,分层分类(HC)面临着诸多挑战,尤其是在类别层次结构中,许多类别可用的标注文档稀缺,这使得构建良好的分类模型变得困难。本文将介绍线性判别分析(LDA)和分层判别分析(sDA)在分层文本分类中的应用,并通过实验验证sDA模型的有效性。
线性判别分析(LDA)
LDA通常被定义为数据点的一种变换,其目标是将数据点投影到一个新的空间,使得类间分离度最大化,同时类内相似度最大化。具体来说,给定一组包含$m$个示例及其对应类别的数据集$F = {(x_1, y_1), (x_2, y_2), \ldots, (x_m, y_m)}$,其中$X = {x_1, x_2, \ldots, x_m}$,$x_i \in R^p$是第$i$个示例,用$p$维行向量表示;$Y = {y_1, y_2, \ldots, y_m} \subset C$,$y_i \subset {1, \ldots, c}$是示例$x_i$的标签集合,$c = |C|$。LDA的目标是找到一个线性变换矩阵$A \in R^{p\times l}$,将每个示例向量$x_i$投影到$z_i = x_iA$,其中$z$是投影到$l$维空间($l \ll p$)的示例,并且类间分离度最大化。
为了实现这一目标,LDA最大化以下方程:
[a^ = \arg \max_{a} \frac{a^T Ba}{a^T Wa}]
其中,$a$是矩阵$A$中的投影向量,我们需要寻找一组$l$个投影向量。在上述方程中,我们定义类间协方差矩阵$B$和类内协方差矩阵$W$如下:
[B = \sum_{k=1}^{c} m_k(\mu_k - \mu)(\m
超级会员免费看
订阅专栏 解锁全文
3892

被折叠的 条评论
为什么被折叠?



