
机器学习
文章平均质量分 54
manong_wxd
这个作者很懒,什么都没留下…
展开
-
机器学习总结(一)——有监督和无监督、生成模型和判别模型
1. 有监督与无监督的区别是否为有监督需要看输入的数据是否含有标签(label)。 数据含有标签,为有监督;不含有标签,为无监督;半监督学习:综合利用有类标签的数据和没有类标签的数据,来生成合适的分类函数。利用少量标注样本和大量未标注样本进行机器学习,从概率学习角度可理解为研究如何利用训练样本的输入边缘概率 P(x)和条件输出概率P (y|x)的联系设计具有良好性能的分类器。2. 生成模型与原创 2017-12-07 20:23:07 · 13242 阅读 · 0 评论 -
机器学习总结(三)——SVM
1. SVM的原理是什么svm是一种二分类模型,是一种在特征空间中寻找间隔最大化的分离超平面的线性分类器。线性可分样本:可以通过硬间隔最大化学习线性分类器实现。近似线性可分:通过引入松弛变量,通过软间隔最大化,学习线性分类器;非线性样本:通过核技巧与软间隔最大化学习非线性支持向量机;2. SVM为什么采用间隔最大化利用间隔最大化求得的最优分离超平面是唯一的。分离超平面产生的分类结果是最鲁棒的原创 2017-12-07 20:45:40 · 973 阅读 · 0 评论 -
机器学习总结(四)——随机森林与GBDT(梯度提升决策树)
1. 随机森林简介随机森林采用的是bagging的思想,bagging即:通过在训练样本集中进行有放回的采样得到多个采样集,基于每个采样集训练出一个基学习器,再将基学习器结合起来共同实现分类或者回归。随机森林在对决策树进行bagging的基础上,在决策树的训练过程中引入了随机属性选择。传统决策树在选择划分属性的时候是在当前节点属性集合中选择最优属性,而随机森林则是对结点先随机选择包含k个属性的子集,原创 2017-12-07 20:51:07 · 5538 阅读 · 0 评论