
机器学习
R3
我是一名学生,希望与大家相互交流
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
机器学习之模型融合(详解Stacking,Blending)
模型融合Ensemble Generation常见模型融合的方法boostingbaggingStackingblending各种模型融合的区别集成学习和多模型融合的区别集成学习是指多个弱分类器(子模型)集成为强分类器,这种弱分类器是同质的分类器,比如GBDT,Adaboost,RF等。根据弱分类器之间的关系,可以分为相关(第i个弱分类器依赖于第i-1个弱分类器)和独立(每个弱分类器相互...原创 2020-01-16 13:49:36 · 6007 阅读 · 4 评论 -
机器学习算法集锦:从贝叶斯到深度学习及各自优缺点
转载自:https://zhuanlan.zhihu.com/p/25327755在我们日常生活中所用到的推荐系统、智能图片美化应用和聊天机器人等应用中,各种各样的机器学习和数据处理算法正在尽职尽责地发挥自己的功效。本文筛选并简单介绍一些最常见的算法类别,还为每一个类别列出了一些实际算法并简单介绍了它们的优缺点。相关连接:https://static.coggle.it/diagram/...转载 2020-01-14 17:20:37 · 1093 阅读 · 0 评论 -
训练集、测试集、验证集与交叉验证
引言当我们训练好一个模型时,我们不只希望这个模型只在训练集上表现的好,更重要的是希望这个模型后续能表现的好原创 2019-12-17 16:38:34 · 2292 阅读 · 1 评论 -
相关性分析(二)之离散特征
信息熵基础xix_ixi的自信息: 反映特征的某个值,具有非负、单调减、可加和不确定性。表示收到某消息获得的信息量(即,收到某消息后获得关于某事件发生的信息量),公式如下:I(xi)=f[p(xi)]=−logrp(xi),r=2I(x_i)=f[p(x_i)]=-log_rp(x_i),r=2I(xi)=f[p(xi)]=−logrp(xi),r=2条件的自信息量:I(xi...原创 2019-12-16 16:25:57 · 4046 阅读 · 0 评论 -
相关性分析(一)之连续特征
相关性分析分析两个特征的相关程度叫做相关性分析,比如“身高”与“体重”两个特征,就可以使用相关性分析找到两者的相关关系。正相关/负相关/不相关图表分析两组数量不大的数据时,可以用图表法,常见的图表法有以下两种:折线(时间维度):双坐标折线图散点图图表可以清晰的展现相关关系,但无法准确度量,且缺乏说服力。协方差协方差公公式如下:x和y分别表示的是两个特征,这两个特征都有n条:...原创 2019-11-29 14:58:44 · 1165 阅读 · 0 评论 -
样本相似度度量
样本相似度度量分类时,有时需要估算样本之间的相似度,这时候就需要进行相似度度量。常见的相似度度量有以下几种:欧氏距离两个样本a(x11, x12, x13, … ,x1n)和b(x21, x22, x23, x2n)的欧氏距离:欧氏距离基于各维度特征的绝对数值,因此欧氏距离需要保证各维度指标在相同的刻度级别标准化欧氏距离标准欧氏距离是针对欧氏距离的缺点而作的一种改进。其基本思路为...原创 2019-11-07 11:14:05 · 5875 阅读 · 0 评论 -
数据预处理(三)数据变换
文章目录数据变换一、特征二值化二、特征归一化(一)、总和标准化(二)、标准差标准化(三)、极大值标准化(四)、极差标准化(区间放缩法,0-1标准化)三、连续特征变换四、定性特征哑编码:One-hot编码数据变换数据变换即对数据进行规范化处理,以便于后续的信息挖掘。常见的数据变换包括:特征二值化、特征归一化、连续特征变化,定性特征哑编码等。一、特征二值化特征二值化的核心在于设定一个阈值,将特...原创 2018-11-27 10:24:12 · 19892 阅读 · 0 评论 -
数据预处理(一)直观分析
一、直观分析:作图通过作图可以观察数据的分布情况,一般观察图上的几点:找到数据的平均值、标准差、众数、中位数、置信区间、局部峰值等分析数据变化情况及变化的原因。...原创 2018-11-02 16:46:52 · 629 阅读 · 0 评论 -
数据预处理(二)数据清理
文章目录一、直观分析:作图二、数据清理数据去重错误数据纠正格式标准化异常值处理三、数据变换特征二值化特征归一化连续特征变换特征哑编码四、特征离散化五、数据集成六、正负样本均衡一、直观分析:作图二、数据清理数据去重错误数据纠正格式标准化异常值处理三、数据变换特征二值化特征归一化连续特征变换特征哑编码四、特征离散化五、数据集成六、正负样本均衡...原创 2018-11-02 16:46:28 · 1668 阅读 · 0 评论 -
机器学习思维导图
机器学习思维导图机器学习思维导图思维导图解释需求分析与数据获取数据预处理特征工程算法模型模型评估机器学习思维导图思维导图解释需求分析与数据获取在需求分析与数据获取中,我们往往要考虑以下几个方面:确定模型目标根据目标得到所需的相关因素?特征的定义方式(比如,一周用户心情,是要取平均值还是方差呢)?这些特征该是连续的还是离散的呢?离散特征应该如何划分比较合理?对于数据...原创 2018-11-01 14:12:18 · 10454 阅读 · 0 评论