分类是指有效的判断出样本的属性类别。是有监督学习的一种,主要流程是:
(1)训练过程:从样本集中进行特征选取,对分类模型进行训练,从而形成分类器;
(2)识别过程:首选对要识别的样本进行特征选取,然后利用分类器对其进行分类。
分类的技术有很多:决策树、贝叶斯网络、神经网络、遗产算法等。
1、基于朴素贝叶斯的分类器
朴素贝叶斯分类器是特征条件独立假设并基于贝叶斯定理的分类方法。
贝叶斯定理:通常,A事件在B事件发生的条件下发生的概率不等于B事件在A事件发生的条件下发生的概率。然而二者有着一定的关系:事件B发生的条件下事件A发生的概率等于事件A发生的前提下事件B发生的概率乘事件A发生的概率再除事件B发生的概率。P(A|B)=P(B|A)*P(A)/P(B)
2、基于AdaBoost分类器
3、基于K近邻算法的分类器
4、基于支持向量机的分类器