名称 |
假设 /关键 |
优缺点 |
模型 |
策略 |
算法 |
感知机 |
拉格朗日对偶 |
1.初值不同结果不同 2.无法处理非线性 3.对偶形式将内积存储(Gram矩阵),加速计算 |
|
误分类点总数最小 |
梯度下降 |
KNN |
1.k值选择(交叉验证法) 2.距离度量 3.分类决策规则 |
1.对异常点不敏感 2.不具有显示学习过程(可解释行差) 3.适用于多分类问题 4.计算量大(占内存) |
距离度量:p范数(L1、L2) (各个坐标距离最大值 ) |
决策规则:多数表决(=经验风险最小化) |
1.计算与x最近的k个点(Nk) 2.分类规则(多数表决) 3.kd树(适用于训练实例远大于空间维数的搜素) |
聚类分析 (无监督) |
1.k值选择 2.相似度量(距离) |
1.初值敏感 2.异常点敏感 3.kmeans适合球状 4.大数据集伸缩性好,高效,高斯分布效果好 |
质心: |
MSE(均方差): |
数据挖掘--模型选择
最新推荐文章于 2025-06-06 16:59:25 发布