
Machine Learning
TaoTao Li
擅长C/C++、Python、Golang编程
熟悉推理服务、搜索引擎、算法平台化开发
展开
-
机器学习基础-正则化作用详解
正则化的概念在机器学习中经常被提到,本文主要介绍正则化的作用,通过一系列具体的例子,相信能够对正则化有一个非常清晰的认识。转载 2016-10-23 15:22:13 · 4697 阅读 · 0 评论 -
机器学习-特征工程
本文内容来自转载,原文地址:http://blog.youkuaiyun.com/dream_angel_z/article/details/49388733这是一篇关于特征工程的总结类文章,感觉写的很好,因此转载过来作为收藏吧首先,给一张特征工程的思维导图:【如果要浏览图片,建议将其下载到本地,使用图片浏览软件查看】 关于特征工程(Featur转载 2016-10-28 18:03:08 · 573 阅读 · 0 评论 -
机器学习-GBDT
GBDT:梯度提升决策树本文内容全部转载自点击打开链接,因为感觉讲解的很清晰,所以转载过来,便于收藏查看吧综述 GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就转载 2016-10-27 13:57:57 · 843 阅读 · 0 评论 -
Win/Osx下安装xgboost (win10 64 / Osx 10.11)
xgboost号称是速度快效果好的boosting模型,本文主要记录下windows安装xgboost python package全部过程原创 2016-11-09 10:28:03 · 805 阅读 · 0 评论 -
Kaggle 机器学习竞赛冠军及优胜者的源代码汇总
本文内容转载自http://blog.youkuaiyun.com/qq_26898461/article/details/49275401阅读目录Algorithmic Trading Challenge25Allstate Purchase Prediction Challenge3Amazon.com – Employee Access Challenge6AMS 2013-2014 S转载 2016-11-18 22:52:31 · 2783 阅读 · 0 评论 -
ROC AUC指标详解
ROC(Receiver Operating Characteristic)曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣,对两者的简单介绍见这里。这篇博文简单介绍ROC和AUC的特点,以及更为深入地,讨论如何作出ROC曲线图以及计算AUC。ROC曲线需要提前说明的是,我们这里只讨论二值分类器。对于分类器,或者说分类算法,评价指标主要有preci转载 2017-05-03 11:09:29 · 762 阅读 · 0 评论 -
偏差bias/方差variance 的理解
1. 模型的偏差以及方差:模型的偏差:是一个相对来说简单的概念:训练出来的模型在训练集上的准确度。模型的方差:模型是随机变量。设样本容量为n的训练集为随机变量的集合(X1, X2, ..., Xn),那么模型是以这些随机变量为输入的随机变量函数(其本身仍然是随机变量):F(X1, X2, ..., Xn)。抽样的随机性带来了模型的随机性。我们认为方差越大的模型越容易过拟合:转载 2017-05-03 11:31:35 · 2208 阅读 · 0 评论 -
树模型(1)-入门指南
原文地址:https://www.analyticsvidhya.com/blog/2016/04/complete-tutorial-tree-based-modeling-scratch-in-python/翻译时间:2017年4月翻译作者:FBeetle简介基于树的学习算法被认为是非监督学习方法中最好的并且是最常用的方法之一。基于树的方法使得模型的精确率很高,很稳定和翻译 2017-05-09 19:13:15 · 24456 阅读 · 1 评论