- 博客(9)
- 收藏
- 关注
原创 混淆矩阵、ROC、AUC
主要内容(1)混淆矩阵(主要指标)(2)绘制ROC(3)AUC(4)多分类-------------------------------------------------------------------------------------------------------------------------一、混淆矩阵样本 预测值 1 0 实...
2018-09-10 15:47:33
6097
原创 统计学习方法概述(模型、策略、算法)
主要内容(只考虑监督学习)(1)统计学习三要素概述(2)策略(目标函数、代价函数、损失函数)-------------------------------------------------------------------------------------------------------------------------一、统计学习方法概述统计学习三要素:方法 = ...
2018-09-04 15:55:18
4273
原创 Bagging与Boosting
主要内容(1)Bagging和Boosting简介(2)Bagging和Boosting联系和区别(3)Bagging和Boosting相关算法------------------------------------------------------------------------------------------------------------------------...
2018-08-29 10:54:17
734
原创 CART树(分类回归树)
主要内容(1)CART树简介(2)CART树节点分裂规则(3)剪枝---------------------------------------------------------------------------------------------------------------------一、简介CART分类回归树是一种典型的二叉决策树,可以做分类或者回归。若预测...
2018-08-28 16:37:58
3835
原创 C4.5算法
主要内容(1)C4.5算法简介(2)C4.5算法节点分裂规则-------------------------------------------------------------------------------------------------------------------------一、概述参照ID3:https://blog.youkuaiyun.com/gyq423/...
2018-08-27 19:05:09
616
原创 ID3算法(含实例)
主要内容(1)ID3算法简介(2)ID3算法节点分裂规则(3)ID3算法实例(4)剪枝-------------------------------------------------------------------------------------------------------------------------一、简介1、信息熵Entropy其中...
2018-08-27 17:38:46
33024
1
原创 极大似然估计——简述
一、概念极大似然估计,也就是说在模型分布已知的情况下,观察有限的样本信息,反推出最有可能(最大概率)导致该样本出现的模型参数值,即“模型已知,参数未知”。假设某一模型满足正态分布我们可以通过极大似然估计,估计出和两个参数值,接着就可以使用正态分布的相关特性。二、举例假如有一个袋子,袋子中有白、黑两种颜色的球,不知道里面的数量和比例,但又不能全部倒出来去数。现在我们可以这...
2018-08-27 16:17:10
2867
转载 特征工程
1 特征工程是什么? 有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。通过总结和归纳,人们认为特征工程包括以下方面:上图链接 特征处理是特征工程的核心部分,sklearn提供了较为完整的特征处理方法,包括数
2017-07-12 17:39:57
373
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人