1、LR原理及公式推导,有哪些优化方法,梯度下降,牛顿法以及各种变种,L1、L2范数的区别,优缺点。
2、GBDT、XGBOOST原理异同,如何并行化等等(最好去xgboost官方看原始论文,讲得很清楚)随机森林原理及细节。
3、如何解决数据不均衡问题。SVM原理及细节,SVM和树模型的异同以及优缺点和局限性。
4、推荐系统,协同过滤原理,基于用户、物品等等。深度学习中的一些小问题,比如relu是什么,如何解决梯度消失等等,这个最好了解下,毕竟深度学习这么火。
5项目经历项目这块,无论是数据挖掘竞赛还是一些项目,一定要自己把整个过程梳理一下,切记一问项目就是 ”提特征,跑模型,拿第一“,需要把项目的亮点体现出来,说白了就是你这个项目为什么牛逼,你做出了哪些厉害的贡献,这个需要技巧和准备。
本文深入探讨了机器学习中的关键算法,包括逻辑回归及其优化方法、梯度提升决策树与随机森林的区别与联系、支持向量机的工作原理,以及解决数据不平衡问题的方法。此外,还涉及了深度学习的基础概念和技术挑战。
1103

被折叠的 条评论
为什么被折叠?



