25、概率空间中的监督分类及相关实验探索

概率空间中的监督分类及相关实验探索

1. 引言

在文档分类领域,监督分类方法是一种重要的手段。本文将聚焦于概率空间中的监督分类方法,尤其是似然比方法,并通过实验展示其在文档分类中的应用。同时,还会介绍多层感知器(MLP)在潜在狄利克雷分配(LDA)主题概率空间中的分类应用,最后探讨不同分类方法的性能比较及相关实验。

2. 似然比框架

2.1 二元分类准则

考虑将给定数据集划分为两个互斥类别 A 和 B 的情况。根据贝叶斯规则,给定观察文档 D 时,每个类别的发生概率可以表示为:
[p(A|D) = \frac{p(D|A) \times p(A)}{p(D)}]
[p(B|D) = \frac{p(D|B) \times p(B)}{p(D)}]
取两者的比值可得:
[ \frac{p(A|D)}{p(B|D)} = \frac{p(D|A)}{p(D|B)} \times \frac{p(A)}{p(B)} ]
这个结果为二元分类提供了一个简单的准则:如果 (\frac{p(A|D)}{p(B|D)} > 1),则文档 D 最有可能属于类别 A;否则,文档 D 最有可能属于类别 B。为了评估这个概率比是否大于或小于 1,我们考虑对等式右边取对数:
[ \log(\frac{p(D|A)}{p(D|B)}) + \log(\frac{p(A)}{p(B)}) ]
进一步化简后,似然比分类准则可以重述为:
[ D \leftarrow A \quad \text{if} \quad [\log(p(D|A)) - \log(p(D|B))] > \zeta ] <

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值