机器学习之——算法比较与选择

CBF

于 2015-05-07 22:09:10 发布

阅读量1.6k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/u012654283/article/details/45567713

版权

本文探讨了在机器学习中如何选择分类算法，分别介绍了Naive Bayes、Logistic Regression、Decision Trees、SVM、ANN和KNN的优缺点。强调了在选择算法时考虑数据质量、特征工程以及算法的适用场景的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这里写图片描述
　　对于一个分类问题该如何选择分类算法呢？当然，如果你真的关心准确性（accuracy），最好尝试多个算法，每个算法进行参数调优后，进行交叉验证（cross-validation）。但是在解决分类问题时，还是可以参考一些一般性的分类原则的。

Naive Bayes
优点：简单，如果条件独立性假设成立，Naive Bayes 分类器会比判别模型（logistic regression）更快的建立，从而对训练集的规模需求较小。即使假设不成立，该方法也会有很好的结果。
缺点：在于你无法用它来研究各个feature之间的关系。

Logistic Regression
优点：因为有足够多正则化模型的方式，你不必担心各个feature之间的相关性（NB不行）。同时，有不错的概率解释（决策树和SVM不行），引入新数据后可以快速更新模型（使用在线梯度下降法）。

Decision Trees
优点：（1）因为是非参数化的方法，不必关注离群点和是否线性可分；（2）能够同时处理数据型和常规型属性；
缺点：࿰

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。