机器学习实战总结

最新推荐文章于 2020-03-23 20:11:28 发布

原创最新推荐文章于 2020-03-23 20:11:28 发布 · 204 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #机器学习实战

机器学习专栏收录该内容

22 篇文章

订阅专栏

K-近邻算法
优点：精度高对异常值不敏感无数据输入假定
缺点：复杂度高
适用范围：数值型标称型

收集数据
准备数据距离计算所需要的数据。最好结构化
分析数据
训练算法不适合
测试算法计算错误率
使用算法
2. 决策树
优点：计算复杂度不高输出结果易于理解可以处理不相关特征数据
缺点：过度匹配

收集数据
准备数据只适用于标称型，数值型离散化
分析数据
训练算法构造树的数据结构
测试算法计算错误率
使用算法使用任何监督学习

朴素贝叶斯
优点：数据很少也有效
缺点: 数据输入格式敏感
适用：标称型
Logistic回归
优点：计算代价低
缺点：欠拟合分类精度不高
适用：数值型标称型
支持向量机
优点：泛化错误率低计算开销小
缺点：参数调节核函数敏感二分类
AdaBoost提高分类性能
优点：泛化错误率低
缺点：离群点敏感

**

利用回归预测数值型数据

**

线性回归
优点：计算容易
缺点：对非对成型拟合差
树回归
优点：非对成型复杂建模

**

无监督学习

**

利用K-均值聚类对未标注数据分组
缺点：收敛到局部最小值大规模数据上收敛慢
FP-growth高效发现频繁项集
缺点：大规模收敛慢

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。