
机器学习
文章平均质量分 81
荪荪
这个作者很懒,什么都没留下…
展开
-
Bagging和Boosting 概念及区别
转载:http://www.cnblogs.com/liuwu265/p/4690486.html Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个性能更加强大的分类器,更准确的说这是一种分类算法的组装方法。即将弱分类器组装成强分类器的方法。首先介绍Bootstraping,即自助法:它是一种有放回的抽样方法(可能抽到重复的样本)。1、转载 2017-07-19 16:57:23 · 1406 阅读 · 0 评论 -
【机器学习】SVM学习(二):线性分类器
转载:http://blog.youkuaiyun.com/qll125596718/article/details/69039851.线性分类器概念 线性分类器(一定意义上,也可以叫做感知机) 是最简单也很有效的分类器形式.在一个线性分类器中,可以看到SVM形成的思路,并接触很多SVM的核心概念。用一个二维空间里仅有两类样本的分类问题来举个小例子。如图所示:转载 2016-10-10 17:06:27 · 1892 阅读 · 0 评论 -
【机器学习】SVM学习(一):SVM概念
转载:http://blog.youkuaiyun.com/qll125596718/article/details/6900989支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。 支持向量机方法是建立在统计学习理论转载 2016-10-10 16:29:49 · 1144 阅读 · 0 评论 -
【机器学习基础概念】VC维的来龙去脉
转载:http://www.mamicode.com/info-detail-1148920.html原作者:vincentyao 原文链接: http://dataunion.org/14581.html目录:说说历史Hoeffding不等式Connection to Learning学习可行的两个核心条件Effective Number of转载 2016-10-10 15:50:23 · 6039 阅读 · 1 评论 -
【机器学习基础概念】过拟合,交叉验证,VC维
过拟合概念理解:为了使分类器能够对训练数据进行完全正确的分类,而把分类器构造得过度精细复杂,使得训练数据稍微有改动,分类器就会失效。简单点理解就是,能够正确甚至百分百分类训练数据,对于测试数据却不能得到很好的结果。出现原因:出现这种现象的主要原因是训练数据中存在噪音或者训练数据太少交叉验证也称为循环估计,是将一个样本集,分割成两个子集,一个作为训练数据用,一原创 2016-10-10 15:45:49 · 1472 阅读 · 0 评论 -
HOG特征描述算子网址
HOG特征描述算子 http://m.blog.youkuaiyun.com/article/details?id=8454527原创 2016-09-08 15:22:14 · 635 阅读 · 0 评论 -
OpenCV 学习资源整理
学习OpenCV初期入门最大的问题是资料太杂,不同版本之间还有很大差异,很多书籍、资料都是较老的OpenCV 1.0的版本,模块划分数据结构在使用上均有很多不同,而在网络上的资料中,虽然资料很多,杂七杂八看起来也很乱,经过一段时间段的积累,找到了几个做这块的博客,几个博主均是系统性的学习,这点和我拿来偶尔用的还是有很大区别,看了他们的博客收货很大,这里整理分享。博客博客一:tornad转载 2016-09-08 08:54:02 · 709 阅读 · 0 评论 -
【机器学习】基础机器学习算法
转载:http://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247483901&idx=1&sn=a998e14b66c41dfd8738b76b1bb0cac1本篇内容主要是面向机器学习初学者,介绍常见的机器学习算法,当然,欢迎同行交流。哲学要回答的基本问题是从哪里来、我是谁、到哪里去,寻找答案的过程或许可以借鉴机转载 2016-10-09 13:53:08 · 1240 阅读 · 0 评论 -
纹理分类(一)全局特征
原文来自:http://blog.sina.com.cn/s/blog_631a4cc401013pkn.html———————————————以下为原文———————————————纹理分类是一个很老的topic,但是一些纹理分类的方法为以后的图片分类奠定了基础。首先定义一下纹理图片,他是一个随一下变量变化的函数:纹理表面材质,反射率,光照,照相机和他的角度。转载 2016-09-12 21:00:41 · 5728 阅读 · 0 评论 -
【机器学习】SVM学习(三):线性分类器的求解
转载:http://blog.youkuaiyun.com/qll125596718/article/details/69042891.问题的描述 上节说到我们有了一个线性分类函数,也有了判断解优劣的标准——即有了优化的目标,这个目标就是最大化几何间隔,但是看过一些关于SVM的论文的人一定记得什么优化的目标是要最小化||w||这样的说法,这是怎么回事呢?回头再看看我们对间隔转载 2016-10-10 19:56:49 · 3010 阅读 · 0 评论 -
【机器学习】SVM学习(四):为何需要核函数
转载:http://blog.youkuaiyun.com/qll125596718/article/details/6908480 生存?还是毁灭?——哈姆雷特 可分?还是不可分?——支持向量机 之前一直在讨论的线性分类器,只能对线性可分的样本做处理。如果提供的样本线性不可分,结果很简单,线性分类器的求解程序会无限循环,永远也解不出来。这必转载 2016-10-11 10:10:08 · 1794 阅读 · 0 评论 -
【机器学习】SVM学习(五):松弛变量与惩罚因子
转载:http://blog.youkuaiyun.com/qll125596718/article/details/69109211.松弛变量 现在我们已经把一个本来线性不可分的文本分类问题,通过映射到高维空间而变成了线性可分的。就像下图这样: 圆形和方形的点各有成千上万个(毕竟,这就是我们训练集中文档的数量嘛,当然很大了)。现在想象我们有另一个训转载 2016-10-11 13:05:35 · 6568 阅读 · 0 评论 -
【车牌识别收纳】
http://www.cnblogs.com/subconscious/p/3979988.html#!comments原创 2017-05-06 13:40:29 · 999 阅读 · 0 评论 -
【数学:线性代数】如何生动有趣的入门线性代数
转载:http://blog.youkuaiyun.com/u010751535/article/details/52856123#%E7%9F%A9%E9%98%B5%E4%B9%98%E6%B3%95已精通线性代数的朋友,不需要看这篇文章。写给那些不同专业又对人工智能感兴趣的同学们:我和别人不太一样,未来就业的恐惧和压力驱动不了我,能驱动我前进的只有精神动力。而自高中开始我转载 2016-10-31 15:44:20 · 7295 阅读 · 0 评论 -
【机器学习Machine Learning】资料大全
转载:http://www.cnblogs.com/charlotte77/p/5488488.html 昨天总结了深度学习的资料,今天把机器学习的资料也总结一下(友情提示:有些网站需要"科学上网"^_^) 推荐几本好书:1.Pattern Recognition and Machine Learning (by Hastie, Tibshirani, and Fri转载 2016-10-05 16:07:15 · 3894 阅读 · 0 评论 -
机器学习(Machine Learning)&深度学习(Deep Learning)资料(下)
转载:http://www.jianshu.com/p/b73b6953e849该资源的github地址:Qix《Statistical foundations of machine learning》介绍:《机器学习的统计基础》在线版,该手册希望在理论与实践之间找到平衡点,各主要内容都伴有实际例子及数据,书中的例子程序都是用R语言编写的。《A Deep Learning转载 2016-10-05 15:48:32 · 1945 阅读 · 0 评论 -
机器学习(Machine Learning)&深度学习(Deep Learning)资料汇总
转载:http://dataunion.org/8463.html?utm_source=tuicool&utm_medium=referral《Brief History of Machine Learning》介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost到随机森林、Deep Learning.《Dee转载 2016-10-05 15:43:25 · 1629 阅读 · 0 评论 -
【数学】奇异值分解(SVD)原理详解及推导
http://blog.youkuaiyun.com/zhongkejingwang/article/details/43053513原创 2016-11-03 15:46:37 · 2142 阅读 · 0 评论 -
【机器学习】SVM学习(六):将SVM用于多类分类
转载“”:http://blog.youkuaiyun.com/qll125596718/article/details/6911328 从 SVM的那几张图可以看出来,SVM是一种典型的两类分类器,即它只回答属于正类还是负类的问题。而现实中要解决的问题,往往是多类的问题(少部分例外,例如垃圾邮件过滤,就只需要确定“是”还是“不是”垃圾邮件),比如文本分类,比如数字识别。如何由两类分类器得到转载 2016-10-11 13:47:18 · 2247 阅读 · 0 评论 -
随机森林临时收纳集
Python 实现的随机森林 - 开源中国社区 http://www.oschina.net/translate/random-forests-in-python?cmp原创 2016-08-09 13:46:41 · 616 阅读 · 0 评论 -
手把手生成决策树(dicision tree)
原文链接:http://blog.youkuaiyun.com/xuelabizp/article/details/509794691.什么是决策树决策树是一种基本的分类和回归方法,本文主要讲解用于分类的决策树。决策树就是根据相关的条件进行分类的一种树形结构,比如某高端约会网站针对女客户约会对象见面的安排过程就是一个决策树: 根据给定的数据集创建一个决策树就是机器学习的课程,创建一转载 2016-08-09 14:35:46 · 5563 阅读 · 1 评论 -
Weka算法Classifier-tree-RandomForest源码分析(二)代码实现,randomforest
http://www.bkjia.com/ASPjc/876833.htmlRandomForest的实现异常的简单,简单的超出博主的预期,Weka在实现方式上组合了Bagging和RandomTree。一、RandomForest的训练构建RandomForest的代码如下: public void buildClassifier(Insta转载 2016-07-15 20:44:59 · 1395 阅读 · 0 评论 -
结构化随机森林源码分析
转载:http://blog.youkuaiyun.com/wdhxek/article/details/50437556文章信息与源码来源http://www.dsi.unive.it/~srotabul/#publicationsRandom Tree 类库设计分析看完作者的源码,对C++的继承与派生,派生,更为深刻的理解。基类指定规则,固定好程序的转载 2016-07-15 20:21:27 · 1016 阅读 · 0 评论 -
随机森林算法的源码分析(一)
转载:http://blog.youkuaiyun.com/wdhxek/article/details/50425140原作者&源码信息http://www.andres.sc/http://www.andres.sc/code.html实现分析数据结构的角度进行扩展,决策森林,决策树,决策节点从学习的角度:划分为森林的学习,树的学习与转载 2016-07-15 20:20:09 · 2762 阅读 · 0 评论 -
【机器学习详解】决策树与随机森林算法
http://www.2cto.com/kf/201607/522502.html决策树决策树模型是一种树形结构,基于特征对实例进行分类或回归的过程。即根据某个特征把数据分划分到若干个子区域(子树),再对子区域递归划分,直到满足某个条件则停止划分并作为叶子节点,不满足条件则继续递归划分。一个简单的决策树分类模型:红色框出的是特征。 决策转载 2016-07-15 20:06:49 · 10488 阅读 · 1 评论 -
机器学习中的数学(2)-线性回归,偏差、方差权衡
http://www.cnblogs.com/LeftNotEasy/archive/2010/12/19/mathmatic_in_machine_learning_2_regression_and_bias_variance_trade_off.html版权声明: 本文由LeftNotEasy所有,发布于http://leftnoteasy.cnblogs.com。如转载 2016-07-15 14:25:25 · 673 阅读 · 0 评论 -
机器学习中的数学(1)-回归(regression)、梯度下降(gradient descent)
http://www.cnblogs.com/LeftNotEasy/archive/2010/12/05/mathmatic_in_machine_learning_1_regression_and_gradient_descent.html版权声明: 本文由LeftNotEasy所有,发布于http://leftnoteasy.cnblogs.com。如果转载,请注明出转载 2016-07-15 14:22:10 · 554 阅读 · 0 评论 -
机器学习的算法(1):决策树之随机森林
版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com前言: 决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)转载 2016-07-14 20:36:50 · 6017 阅读 · 2 评论 -
ICCV2013 录用论文(目标跟踪相关部分)
转载网址:http://blog.youkuaiyun.com/gxf1027/article/details/11581149ICCV13, 所有论文下载地址, 请猛戳 目前(截止9月11日晚)官网上只有录用论文的ID,但是在Kyros Kutulakos主页上放出了所有收录论文的title和作者。现在只待各作者主页上放出draft了。以下将列出视觉跟踪方面的收录转载 2016-06-24 16:58:11 · 715 阅读 · 0 评论 -
基于随机森林的特征选择算法
http://xuebao.jlu.edu.cn/gxb/article/2014/1671-5497-44-1-137.html0 引言图像处理、信息检索以及生物信息学等技术的发展,产生了以超大规模特征为特点的高维数据集。如何有效地从高维数据中提取或选择出有用的特征信息或规律,并将其分类识别已成为当今信息科学与技术所面临的基本问题[ 1]。特征选择是指从原始特征集中选择使转载 2016-07-18 09:16:46 · 59305 阅读 · 25 评论 -
机器学习与深度学习资料收纳
1.机器学习 - 标签 - Charlotte77 - 博客园 http://www.cnblogs.com/charlotte77/tag/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/#rd原创 2016-07-19 00:16:40 · 800 阅读 · 0 评论 -
随机森林
http://www.36dsj.com/archives/32820简介近年来,随机森林模型在界内的关注度与受欢迎程度有着显著的提升,这多半归功于它可以快速地被应用到几乎任何的数据科学问题中去,从而使人们能够高效快捷地获得第一组基准测试结果。在各种各样的问题中,随机森林一次又一次地展示出令人难以置信的强大,而与此同时它又是如此的方便实用。需要大家注意的是,在上文中转载 2016-08-09 13:37:02 · 1523 阅读 · 0 评论 -
机器学习中的算法——决策树模型组合之随机森林与GBDT
前言:决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)等。但是同时,单决策树又有一些不好的地方,比如说容易over-fitting,虽然有一些方法,如剪枝可以减少这种情况,但是还是不够的。美国金融银行业的大数据算法:随机森林模型+综合模型模型组合(比如说有Boosting,Bagging等)与转载 2016-08-09 13:35:40 · 908 阅读 · 0 评论 -
随机森林
http://blog.sina.com.cn/s/blog_7673d4a50102vm6i.html随机森林利用随机的方式将许多决策树组合成一个森林,每个决策树在分类的时候投票决定测试样本的最终类别。下面我们再详细说一下随机森林是如何构建的。随机森林主要包括4个部分:随机选择样本;随机选择特征;构建决策树;随机森林投票分类。1.随机选择样本转载 2016-08-09 10:48:58 · 852 阅读 · 0 评论 -
随机森林代码注释(C++版本)
1. 随机森林随机森林属于非传统式的机器学习算法,由多颗决策树组成,每棵决策树处理的是一个训练样本子集。训练阶段,通过决策树的节点分裂来筛选特征,层层对样本进行细分,直至将每个训练样本子集分类正确,测试阶段,直接基于训练出的特征进行样本分类,所以测试速度较快(但训练速度较慢)。属于“傻瓜式”的策略(这点和adaboost很像很像),以下部分是标准随机森林训练阶段的大致流程。1.假如有N转载 2016-08-09 09:24:38 · 7928 阅读 · 7 评论 -
RandomForest随机森林总结
1.随机森林原理介绍随机森林,指的是利用多棵树对样本进行训练并预测的一种分类器。该分类器最早由Leo Breiman和Adele Cutler提出,并被注册成了商标。简单来说,随机森林就是由多棵CART(Classification And Regression Tree)构成的。对于每棵树,它们使用的训练集是从总的训练集中有放回采样出来的,这意味着,总的训练集中的有些样本可能多次出现在一原创 2016-08-08 20:40:05 · 2460 阅读 · 0 评论 -
Matlab批量读取元胞数组中数据保存到txt文件中(WIDER FACE数据集中,读取人脸标注矩形框信息)
http://blog.youkuaiyun.com/xzzppp/article/details/51888603WIDER FACE:http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/1、文件说明:"wider_face_split.zip" 文件包含三个子文件:wider_face_train.mat, wider_转载 2016-08-26 18:30:20 · 2194 阅读 · 0 评论 -
casecade结构和HAAR检测流程
转载:http://blog.youkuaiyun.com/nongfu_spring/article/details/38977555//使用样例,其中_cascade为CvHaarClassifierCascade结构,//cascade为CvHidHaarClassifierCascade结构for(i = 0; i _cascade->count; i++转载 2016-08-27 17:44:46 · 1249 阅读 · 0 评论 -
决策树,随机森林,boost小结
决策树(CvDTree)是最基础的,是CvForestTree和CvBoostTree的父类。决策树的生成,一般资料中都是基于ID3算法(熵增益),即ID3算法在每个节点分裂时,选择使gain(A)最大的特征分裂。 Opencv中决策树的生成是基于吉尼不纯度最小的原则生成的。即选择 最小的分裂。其中,m为样本的种类,如只有正负样本,则m为2,p1,p转载 2016-08-27 14:35:05 · 2686 阅读 · 0 评论 -
推荐!国外程序员整理的机器学习资源大全
原文地址:http://www.oschina.net/news/53818/awesome-machine-learning本列表选编了一些机器学习领域牛B的框架、库以及软件(按编程语言排序)。C++计算机视觉CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库OpenCV—它提供C++, C, Python, Java 以及转载 2016-02-29 19:00:31 · 1244 阅读 · 0 评论