
机器学习
文章平均质量分 90
夜空骑士
我是一名数据玩家,对数据行业的知识有着极大的学习热情,在数据分析、数据挖掘、大数据、人工智能等多个方面均有所涉猎,致力于将数据技术应用于各个行业领域,不断提升自我、完善自我、充实自我,并与数据爱好者共同分享、共同进步、共同成长!数据之路,前路漫漫,你我同在,互动前行!
展开
-
【机器学习】一文详解GBDT、Xgboost、Boosting与Bagging之间的区别
GBDT与Xgboost的区别N问GBDT 1. 怎么设置单棵树的停止生长条件? 2. 如何评估特征的权重大小? 3. 当增加样本数量时,训练时长是线性增加的吗? 4. 当增加树的颗数时,训练时长是线性增加的吗? 5. 每个节点上保存什么信息? 6.如何防止过拟合? 7. gbdt 在训练和预测的时候都用到了步长,这两个步长一样么? 8. gbdt中哪些部分可以...转载 2020-03-27 21:59:18 · 1836 阅读 · 0 评论 -
机器学习中用可视化手段来进行模型评估和参数调优
本篇文章详细阐述机器学习模型评估和参数调优。将主要围绕两个问题来阐述:“知其所以然”:当你选择的一个机器学习模型运行时,你要知道它是如何工作的;“青出于蓝”:更进一步,你得知道如何让此机器学习模型工作的更优。模型评估的方法一般情况来说,F1评分或者R平方(R-Squared value)等数值评分可以告诉我们训练的机器学习模型的好坏。也有其它许多度量方式来评原创 2017-04-27 15:27:51 · 5725 阅读 · 0 评论 -
机器学习——武林盟主分享机器学习之武功秘籍
机器学习研究的是计算机怎样模拟人类的学习行为,以获取新的知识或技能,并重新组织已有的知识结构使之不断改善自身。简单一点说,就是计算机从数据中学习出规律和模式,以应用在新数据上做预测的任务。原创 2016-11-08 15:33:35 · 2067 阅读 · 1 评论 -
机器学习——Python实现逻辑回归
逻辑回归是一项可用于预测二分类结果(binary outcome)的统计技术,广泛应用于金融、医学、犯罪学和其他社会科学中。逻辑回归使用简单且非常有效,你可以在许多机器学习、应用统计的书中的前几章中找到个关于逻辑回归的介绍。逻辑回归在许多统计课程中都会用到。原创 2017-01-10 09:04:00 · 5727 阅读 · 0 评论 -
机器学习——贝叶斯分类算法
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本文作为分类算法的第一篇,将首先介绍分类问题,对分类问题进行一个正式的定义。然后,介绍贝叶斯分类算法的基础——贝叶斯定理。最后,通过实例讨论贝叶斯分类中最简单的一种:朴素贝叶斯分类。原创 2017-03-01 15:04:34 · 1455 阅读 · 0 评论 -
机器学习——DBN深度信念网络详解
使用BP算法单独训练每一层的时候,我们发现,必须丢掉网络的第三层,才能级联自联想神经网络。然而,有一种更好的神经网络模型,这就是受限玻尔兹曼机。使用层叠波尔兹曼机组成深度神经网络的方法,在深度学习里被称作深度信念网络DBN,这是目前非常流行的方法。原创 2016-08-11 16:48:02 · 24491 阅读 · 6 评论 -
机器学习——BP神经网络模型
"BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)。"原创 2016-04-26 19:04:46 · 14171 阅读 · 0 评论 -
机器学习——支持向量机SVM在R中的实现
支持向量机是一个相对较新和较先进的机器学习技术,最初提出是为了解决二类分类问题,现在被广泛用于解决多类非线性分类问题和回归问题。继续阅读本文,你将学习到支持向量机如何工作,以及如何利用R语言实现支持向量机。原创 2016-05-09 16:53:53 · 14389 阅读 · 1 评论 -
机器学习——推荐系统中常用的推荐算法简介
在推荐系统简介中,我们给出了推荐系统的一般框架。很明显,推荐方法是整个推荐系统中最核心、最关键的部分,很大程度上决定了推荐系统性能的优劣。目前,主要的推荐方法包括:基于内容推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐和组合推荐。原创 2016-06-14 11:15:34 · 7803 阅读 · 0 评论 -
机器学习——随机森林算法及原理
随机森林顾名思义,是用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决策树之间是没有关联的。在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行一下判断,看看这个样本应该属于哪一类(对于分类算法),然后看看哪一类被选择最多,就预测这个样本为那一类。原创 2016-04-29 09:30:03 · 74969 阅读 · 6 评论