目录
一、决策树:
优点:
- 简单易于理解
- 能够处理多路输出问题
缺点:
- 容易过拟合
- 决策树的生成不稳定,微小的数据变化可能导致生成的决策树不同
二、KNN
优点:
- 简单易于理解
- 无需训练,无需估计参数
- 准确性高
- 适合多标签问题
缺点:
- 懒惰算法,预测慢,开销大
- 类的样本数不平衡时准确率受影响
- 可解释性差
三、朴素贝叶斯
优点:
- 分类稳定
- 适合小规模数据和增量式训练
- 对缺失数据不敏感
缺点:
- 属性相关性大时效果不好
- 需要知道先验概率
-
对数据的表达形式敏感
四、SVM
优点:
- 适合小样本、非线性、高维模式识别
缺点:
- 对于大规模数据开销大
- 不合适多分类
-
对缺失数据敏感
-
需要选择适当的核函数
五、ANN
优点:
- 准确度高
- 并行分布处理能力强
- 对噪声容错率高
缺点:
- 需要大量初始参数
- 训练时间长,甚至可能训练不成功