
机器学习
hren_ron
这个作者很懒,什么都没留下…
展开
-
特征选择(Feature Selection)
主要内容:为什么要进行特征选择? 什么是特征选择? 怎么进行特征选择特征选择:在现实生活中,一个对象往往具有很多属性(以下称为特征),这些特征大致可以被分成三种主要的类型:相关特征:对于学习任务(例如分类问题)有帮助,可以提升学习算法的效果; 无关特征:对于我们的算法没有任何帮助,不会给算法的效果带来任何提升; 冗余特征:不会对我们的算法带来新的信息,或者这种特征的信...原创 2018-07-04 17:00:56 · 81210 阅读 · 4 评论 -
不平衡学习(Imbalanced learning)
数据不平衡在很多真实场景下,数据集往往是不平衡的。也就是说,在数据集中,有一类含有的数据要远远多于其他类的数据(类别分布不平衡)。在这里,我们主要介绍二分类中的类别不平衡问题,对于多类别的不平衡只做简单的介绍。考虑一个简单的例子,假设我们有一个关于医院患者的数据集(里面包含很多患者的图片),我们把其中患有癌症的病人标记为正例,把健康的患者标记为负例。众所周知,健康的人的数量肯定远远大于癌症...原创 2018-07-23 18:15:24 · 23397 阅读 · 7 评论 -
基于梯度的优化算法
梯度下降优化算法大多数学习算法都涉及到优化,优化是指改变 x 以最小化或者最大化某个函数 f(x) 的过程。通常我们所说的优化算法都是指最小化的过程,因此,最大化的过程可以通过最小化 -f(x) 来实现。导数是指某个函数 f(x) 在某一点上的斜率,它可以表明如何缩放输入的小变化才能在输出上获得相应的变化:。因此,导数对于最优化的过程非常有用。例如,如果对于足够小的来说,比 f(x) 小,...原创 2018-08-18 21:49:15 · 12875 阅读 · 2 评论