概率->阈值->分类
要求:每个类别,X的分量都是相互独立的。
有点:优秀、稳健
数据预处理:特征选择过程和主成分分析方法降维后,更合乎假设,一般结果还是不错的。
使用条件:离散变量模型,算法理解容易;可以避免过度拟合可以胜任缺失数据的分类任务。样本小,维度高。
缺点:稀疏敏感-—拉普拉斯平滑。
应用:垃圾邮件分类、银行违约分类、情感分析、精准营销
概率->阈值->分类
要求:每个类别,X的分量都是相互独立的。
有点:优秀、稳健
数据预处理:特征选择过程和主成分分析方法降维后,更合乎假设,一般结果还是不错的。
使用条件:离散变量模型,算法理解容易;可以避免过度拟合可以胜任缺失数据的分类任务。样本小,维度高。
缺点:稀疏敏感-—拉普拉斯平滑。
应用:垃圾邮件分类、银行违约分类、情感分析、精准营销