
机器学习
monkey512
学习python中
展开
-
【机器学习】机器学习中涉及到的距离度量
1.欧氏距离 2.曼哈顿距离 3.切比雪夫距离 4.马氏距离 5.巴氏距离 6.汉明距离 7.皮尔孙系数 8.信息熵 含义 优点 缺点 适用数据原创 2017-10-30 11:01:02 · 341 阅读 · 0 评论 -
决策树-RF-GBDT-XGboost-LightGBM
先记录一些学习过程中看到的比较重要的点,最后再来进行大总结1.xgboost/gbdt在调参时为什么树的深度很少就能达到很高的精度?答案来源:https://www.jianshu.com/p/005a4e6ac775 也就是说,当我们训练一个模型时,偏差和方差都得照顾到,漏掉一个都不行。 对于Bagging算法来说,由于我们会并行地训练很多不同的分类器的目的就是降低这个方差(va...转载 2018-08-18 19:38:56 · 743 阅读 · 0 评论 -
逻辑回归常见面试题总结
转载自:https://www.cnblogs.com/ModifyRong/p/7739955.html转载 2018-08-17 15:40:17 · 4364 阅读 · 0 评论 -
【机器学习】数据处理与特征工程
此外特征工程中还有一个很重要的部分是特征监控,具体不知道怎么做特征有效性分析——特征重要性,权重特征监控——防止特征质量下降,影响模型效果我目前能想到的特征监控的方法大概是,每隔一段时间利用新加进来的数据优化模型时发现有一个之前很重要的特征现在居然不重要了!!!!...转载 2018-08-31 10:11:36 · 406 阅读 · 0 评论 -
【机器学习】常见错误与问题
参考链接: 机器学习常见的六大错误 来源:36大数据 作者:LinkinPark https://www.cnblogs.com/CheeseZH/p/4096546.html机器学习算法需要注意的一些问题(二) https://blog.youkuaiyun.com/xmu_jupiter/article/details/47110363 从特征的角度选择机器学习模型 low level覆盖...转载 2018-08-30 10:15:30 · 236 阅读 · 0 评论 -
【机器学习】好想彻底搞明白L1/L2正则
1.L1/L2的先验说到先验的概念就不得不提到贝叶斯理论的概念,由于现在大家都是提倡大数据的时代,而数据量越大,贝叶斯理论中先验的力量就会越小,但是实际上大多数模型中,尤其是今天我们说的正则化中都有着贝叶斯理论的影子。但是贝叶斯理论真的很难理解的特别透彻,L1/L2的贝叶斯理论其实就是贝叶斯线性回归啦,不过真正的贝叶斯线性回归是增量学习方法进行优化的,而不是利用梯度下降方法,因为梯度下降方...原创 2018-08-30 16:10:50 · 1613 阅读 · 0 评论