NLP入门-Task4 朴素贝叶斯,SVM,LDA

本文介绍了自然语言处理中的三种重要算法:朴素贝叶斯、支持向量机(SVM)和LDA主题模型。朴素贝叶斯基于贝叶斯定理和特征独立假设进行分类;SVM通过找到最大间隔的超平面实现分类,尤其适用于线性可分和不可分情况;LDA是一种主题模型,用于发现文本中的隐藏主题结构。SVM文本分类涉及特征提取、表示和归一化处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

朴素贝叶斯

贝叶斯定理

贝叶斯定理用来描述两个条件概率之间的关系,比如 P(A|B) 和 P(B|A)。按照乘法法则,可以立刻导出:P(A∩B) = P(A)*P(B|A)=P(B)*P(A|B)。如上公式也可变形为:P(B|A) = P(A|B)*P(B) / P(A)。
P(A)是A的先验概率或边缘概率。之所以称为”先验”是因为它不考虑任何B方面的因素。
P(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。
P(B|A)是已知A发生后B的条件概率,也由于得自A的取值而被称作B的后验概率。
P(B)是B的先验概率或边缘概率,也作标准化常量(normalized constant)。

朴素贝叶斯分类

朴素贝叶斯是经典的机器学习算法之一,也是为数不多的基于概率论的分类算法。朴素贝叶斯原理简单,也很容易实现,多用于文本分类,比如垃圾邮件过滤。
朴素贝叶斯中的朴素一词的来源就是假设各特征之间相互独立。这一假设使得朴素贝叶斯算法变得简单,但有时会牺牲一定的分类准确率。
分类任务表达式:
P(类别|特征)= P(特征|类别)P(类别)/P(特征)
朴素贝叶斯分类器公式:
在这里插入图片描述
上式中分母对所有Ck都是相同的,故可以简化为:
在这里插入图片描述
朴素贝叶斯的优缺点:
优点:(1) 算法逻辑简单,易于实现(算法思路很简单,只要使用贝叶斯公式转化即可!)
(2)分类过程中时空开销小(假设特征相互独立,只会涉及到二维存储)
缺点: 朴素贝叶斯假设

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值