
统计学习方法
learn deep learning
没有方向,我便不会行走。Read More ,Write More,Think More
展开
-
数据挖掘十大算法----EM算法(最大期望算法)
数据挖掘十大算法----EM算法(最大期望算法)http://blog.youkuaiyun.com/u011067360/article/details/23702125?utm_source=tuicool&utm_medium=referralhttp://blog.youkuaiyun.com/u011067360/article/category/1833转载 2016-03-24 09:35:04 · 3305 阅读 · 0 评论 -
推荐系统一 :Facebook如何向十亿人推荐东西
为了保证用户体验和使用效果,推荐系统中的机器学习算法一般都是针对完整的数据集进行的。然而,随着推荐系统输入数据量的飞速增长,传统的集中式机器学习算法越来越难以满足应用需求。因此,分布式机器学习算法被提出用来大规模数据集的分析。作为全球排名第一的社交网站,Facebook就需要利用分布式推荐系统来帮助用户找到他们可能感兴趣的页面、组、事件或者游戏等。近日,Facebook就在其官网公布了其推荐系统的转载 2015-06-12 19:51:54 · 2348 阅读 · 0 评论 -
当推荐算法开源包多如牛毛,为什么我们还要专门的推荐算法工程师
原文http://www.cnblogs.com/flclain/p/4211685.html作为一个推荐系统业余爱好者,在机器学习领域的鄙视链中,我感觉一直地位不高,时常被搞NLP CV语音等高科技技术的朋友鄙视。最近甚至被人问,推荐算法开源包多如牛毛,我们为什么还要专门的推荐算法工程师?(难道想要辞退我!?惊)不得不说,我想吐槽这个观点很久了。事实上搞推荐的工作不等于转载 2015-06-12 21:33:07 · 2915 阅读 · 0 评论 -
不到100行代码实现一个简单的推荐系统
一个好的推荐系统推荐的精度必然很高,能够真的发现用户的潜在需求或喜好,提高购物网詀的销量,让视频网站发现用户喜欢的收费电影… 可是要实现一个高精度的推荐系统不是那么容易的,netflix曾经悬赏高额奖金寻找能给其推荐系统的精确度提高10%的人,可见各个公司对推荐系统的重视和一个好的推荐系统确实能带来经济效益。下面咱以电影电视的推荐系统为例,一步一步的来实现一个简单的推荐系统吧, 由于比较简转载 2015-06-12 21:32:07 · 3937 阅读 · 1 评论 -
虽然你不认识我,但我一直在关注你,余老板 (另附:Li Fei-fei的 English Paper)
在微博上看到的,读完还是有些收获的,首先是端正做research的态度。我是从这里看到的:http://www.vjianke.com/ZM0BC.clip ---------------------------------------以下是原文--------------------------------------------- De-mystifyi原创 2015-06-11 21:56:47 · 1632 阅读 · 0 评论 -
跟上DT时代 的9项技能,不想被甩下
在大数据商品化之前, 利用大数据分析工具和技术来取得竞争优势已不再是秘密。2015年, 如果你还在职场上寻找大数据的相关工作, 那么, 这里介绍的9种技能,将帮助你得到一个工作机会。Apache HadoopHadoop现在已经进入第二个10年发展期了, 但不可否认的是, Hadoop在2014年出现了井喷式发展, 由于Hadoop从测试集群向生产和软件供应商方向不断转移, 其转载 2015-06-12 09:33:12 · 765 阅读 · 0 评论 -
【机器学习-斯坦福】学习笔记10 K-means聚类算法 很全面
K-means也是聚类算法中最简单的一种了,但是里面包含的思想却是不一般。最早我使用并实现这个算法是在学习韩爷爷那本数据挖掘的书中,那本书比较注重应用。看了Andrew Ng的这个讲义后才有些明白K-means后面包含的EM思想。 聚类属于无监督学习,以往的回归、朴素贝叶斯、SVM等都是有类别标签y的,也就是说样例中已经给出了样例的分类。而聚类的样本中却没有给定y,只有特征x,比如转载 2015-06-11 22:09:14 · 3852 阅读 · 0 评论 -
文本分类与SVM
转自 http://blog.youkuaiyun.com/zhzhl202/article/details/8197109之前做过一些文本挖掘的项目,比如网页分类、微博情感分析、用户评论挖掘,也曾经将libsvm进行包装,写了一个文本分类的开软软件Tmsvm。所以这里将之前做过一些关于文本分类的东西整理总结一下。1 基础知识1. 1 样本整理文本分类属于有监督的学转载 2015-06-11 22:04:07 · 1273 阅读 · 0 评论 -
KAZE 算法原理与源码分析(四)KAZE特征的性能分析与比较
KAZE系列笔记: http://blog.youkuaiyun.com/chenyusiyuan/article/details/87151291. OpenCV学习笔记(27)KAZE 算法原理与源码分析(一)非线性扩散滤波2. OpenCV学习笔记(28)KAZE 算法原理与源码分析(二)非线性尺度空间构建3. OpenCV学习笔记(29)KAZE 算法原理与源码分析(三)特征检转载 2015-06-11 21:57:33 · 2820 阅读 · 0 评论 -
动态规划:从新手到专家
作者:Hawstein出处:http://hawstein.com/posts/dp-novice-to-advanced.html声明:本文采用以下协议进行授权: 自由转载-非商用-非衍生-保持署名|Creative Commons BY-NC-ND 3.0 ,转载请注明作者及出处。前言本文翻译自TopCoder上的一篇文章: Dynamic Programmin转载 2015-06-12 21:30:31 · 509 阅读 · 0 评论 -
CNN卷积神经网络
转自:http://blog.youkuaiyun.com/u014568921/article/details/45222623 CNN卷积神经网络分类: 卷积神经网络CNN2015-04-23 15:44 75人阅读 评论(1) 收藏 举报cnn目录(?)[+]CNN是一种多层神经网络,基于人工神经网络,在人工转载 2015-07-08 16:48:04 · 8670 阅读 · 0 评论 -
【arXiv】2015 深度学习年度十大论文
【arXiv】2015 深度学习年度十大论文http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=401805759&idx=1&sn=74b731b14185140ea37fe671a73f96d4&scene=0#wechat_redirect2016-01-09 新智元新智元原创1来源:Kdnug转载 2016-01-14 13:27:29 · 2097 阅读 · 0 评论 -
手把手,74行代码实现手写数字识别
手把手,74行代码实现手写数字识别689 次阅读 - 2015.12.29 - 人工智能 - 龙猫http://dataunion.org/20992.html1、 引言:不要站在岸上学游泳“机 器学习”是一个很实践的过程。就像刚开始学游泳,你在只在岸上比划一堆规定动作还不如先跳到水里熟悉水性学习来得快。以我们学习“机器学习”的经验来看, 很多高大上的概念刚开始不懂转载 2016-01-04 14:05:47 · 14416 阅读 · 0 评论 -
七步精通Python机器学习
[书籍介绍] 七步精通Python机器学习 [推广有奖]加关注串个门加好友发消息0关注1粉丝初中生19%还不是VIP/贵宾-威望0 级论坛币19转载 2015-12-14 21:05:42 · 1289 阅读 · 0 评论 -
斯坦福大学(Andrew Ng)机器学习课程讲义
斯坦福大学(Andrew Ng)机器学习课程讲义分类: 模式识别2012-12-13 14:21 3076人阅读 评论(0) 收藏 举报http://see.stanford.edu/see/courseinfo.aspx?coll=348ca38a-3a6d-4052-937d-cb017338d7b1http://www.stanford.edu/c转载 2015-11-12 19:26:09 · 9423 阅读 · 0 评论 -
美国电商是如何用大数据玩转“双十一”的?
美国电商是如何用大数据玩转“双十一”的?硅星闻 11月09日 15:56硅谷 创投 分类 :互联网阅读:13521 抢沙发年底购物季,美国不少电商网站通过分析用户在社交平台上的非结构化数据来分析和定义用户个性和特征,从而实现更精准的营销,同时通过最新的数据分析工具,许多中小企业也可以享受到这样的福利。又到了一年一度的节日——全民购物季,在转载 2015-11-10 11:39:56 · 877 阅读 · 0 评论 -
深入浅出LSTM神经网络 ------从卷积 递归网络 到长短时间记忆模型
深入浅出LSTM神经网络发表于2015-06-05 20:57| 10188次阅读| 来源http://blog.terminal.com| 2 条评论| 作者Zachary Chase LiptonLSTM递归神经网络RNN长短期记忆摘要:根据深度学习三大牛的介绍,LSTM网络已被证明比传统的RNNs更加有效。本文由UCSD研究机器学习理论和应用的博士生Zac转载 2015-11-10 12:59:40 · 14346 阅读 · 0 评论 -
一些重要的算法
一些重要的算法2010年7月12日陈皓发表评论阅读评论40,214 人阅读 下面是一些比较重要的算法,原文罗列了32个,但我觉得有很多是数论里的,和计算机的不相干,所以没有选取。下面的这些,有的我们经常在用,有的基本不用。有的很常见,有的很偏。不过了解一下也是好事。也欢迎你留下你觉得有意义的算法。(注:本篇文章并非翻译,其中的算法描述大部份摘自Wikipe转载 2015-10-22 11:29:52 · 844 阅读 · 0 评论 -
视觉SLAM漫谈123456
视觉SLAM漫谈http://www.cnblogs.com/gaoxiang12/p/3695962.html1. 前言 开始做SLAM(机器人同时定位与建图)研究已经近一年了。从一年级开始对这个方向产生兴趣,到现在为止,也算是对这个领域有了大致的了解。然而越了解,越觉得这个方向难度很大。总体来讲有以下几个原因:入门资料很少。虽然国内也有不少人在做,但这方转载 2015-10-21 15:48:15 · 2920 阅读 · 2 评论 -
模式识别中 核函数 汇总
本文转载自: 收集一下核函数-Kernel Function | 丕子 原文地址:http://www.shamoxia.com/html/y2010/2292.htmlKernel FunctionsBelow is a list of some kernel functions available from the existing litera转载 2015-06-11 15:19:10 · 1450 阅读 · 0 评论 -
整理:深度学习 vs 机器学习 vs 模式识别 ,,全是干货,超链接更丰富
【编者按】本文来自CMU的博士,MIT的博士后,vision.ai的联合创始人Tomasz Malisiewicz的个人博客文章,阅读本文,你可以更好的理解计算机视觉是怎么一回事,同时对机器学习是如何随着时间缓慢发展的也有个直观的认识。以下为正文:本文我们来关注下三个非常相关的概念(深度学习、机器学习和模式识别),以及他们与2015年最热门的科技主题(机器人和人工智能)的联系。转载 2015-06-30 21:03:45 · 2113 阅读 · 0 评论 -
DeepID算法实践
转自:http://blog.youkuaiyun.com/stdcoutzyx/article/details/45570221卷积神经网络DeepID目录(?)[+]DeepID实践转载请注明:http://blog.youkuaiyun.com/stdcoutzyx/article/details/45570221好久没有写博客了,I have failed转载 2015-07-08 08:54:17 · 981 阅读 · 0 评论 -
机器学习有监督学习之--回归
转自http://www.cnblogs.com/fanyabo/p/4060498.html一、引言 本材料参考Andrew Ng大神的机器学习课程 http://cs229.stanford.edu,以及斯坦福无监督学习UFLDL tutorial http://ufldl.stanford.edu/wiki/index.php/UFLDL_Tutorial 机转载 2015-05-14 21:32:50 · 1530 阅读 · 0 评论 -
数据结构中 树(重点kdtree)
(一)树一)树的定义树(Tree)是n个(n>=0)个结点的有限集。 n=0时称之为空树。在任意一个非空树中:(1)有且仅有一个特定的称为根(Root)的结点;(2)当n>1时,其余结点可分为m(m>0)个互不相交的有限集T1,T2,T3...Tm,其中每个集合本身就是一棵树,并且称为根的子树(Subtree)注:n>0时,树根仅为1,不可能存在转载 2015-05-12 10:19:50 · 4992 阅读 · 0 评论 -
RBF网络
径向基函数(RBF) 一、简介 RBF (Radial Basis Function)可以看作是一个高维空间中的曲面拟合(逼近)问题,学习是为了在多维空间中寻找一个能够最佳匹配训练数据的曲面,然后来一批新的数据,用刚才训练的那个曲面来处理(比如分类、回归)。RBF的本质思想是反向传播学习算法应用递归技术,这种技术在统计学中被称为随机逼近。RBF里的basis function转载 2015-05-12 19:40:47 · 1684 阅读 · 0 评论 -
ROC曲线、PRC曲线
转载自 http://www.zhizhihu.com/html/y2012/4076.html(大牛)分类、检索中的评价指标很多,Precision、Recall、Accuracy、F1、ROC、PR Curve......一、历史wiki上说,ROC曲线最先在二战中分析雷达信号,用来检测敌军。诱因是珍珠港事件;由于比较有用,慢慢用到了心理学、医学中的一些检测等应用,慢慢原创 2015-04-13 17:30:50 · 15914 阅读 · 0 评论 -
算法一 knn 中的 最近邻搜索
转自:http://underthehood.blog.51cto.com/2531780/687160By RaySaint 2011/10/12 本文的主要目的是讲一下如何创建k-d tree对目标物体的特征点集合进行数据组织和使用k-d tree最近邻搜索来加速特征点匹配。上面已经讲了特征点匹配的问题其实上是一个最近邻(K近邻)搜索的问题。所以为了更好的引出k-d tree,转载 2014-11-17 14:35:52 · 8332 阅读 · 0 评论 -
算法一 knn 扩展 BBF算法,在KD-tree上找KNN ( K-nearest neighbor)
Step1: BBF算法,在KD-tree上找KNN。第一步做匹配咯~ 1. 什么是KD-tree(from wiki)K-Dimension tree,实际上是一棵平衡二叉树。一般的KD-tree构造过程:function kdtree (list of points pointList, int depth){ if pointList is转载 2014-11-17 14:37:51 · 3967 阅读 · 1 评论 -
算法一 knn介绍,及其扩展
K近邻算法发表于 2012-11-12 下图中,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于红色三角形所占比例为2/3,绿色圆将被赋予红色三角形那个类,如果K=5,由于蓝色四方形比例为3/5,因此绿色圆被赋予蓝色四方形类。 K 最近邻 (k-Nearest Neighbor,KNN) 分类算法,是一个理论上比较成熟的方法,也是最转载 2014-11-17 14:34:14 · 2932 阅读 · 0 评论 -
机器学习--判别式模型与生成式模型
一、引言 本材料参考Andrew Ng大神的机器学习课程 http://cs229.stanford.edu 在上一篇有监督学习回归模型中,我们利用训练集直接对条件概率p(y|x;θ)建模,例如logistic回归就利用hθ(x) = g(θTx)对p(y|x;θ)建模(其中g(z)是sigmoid函数)。假设现在有一个分类问题,要根据一些动物的特征来区分大象(y = 1)和狗(y转载 2015-05-14 21:36:05 · 3171 阅读 · 0 评论 -
RANSAC算法及应用。。
转自:http://blog.youkuaiyun.com/xufuyuan/article/details/7106040本文翻译自维基百科,英文原文地址是:http://en.wikipedia.org/wiki/ransac,如果您英语不错,建议您直接查看原文。 RANSAC是“RANdom SAmple Consensus(随机抽样一致)”的缩写。它可以从一组包含“局外点”的观测数据转载 2015-06-24 11:28:55 · 7164 阅读 · 0 评论 -
几种常见模式识别算法整理和总结
转自:http://blog.youkuaiyun.com/scyscyao/article/details/59875811. K-Nearest NeighborK-NN可以说是一种最直接的用来分类未知数据的方法。基本通过下面这张图跟文字说明就可以明白K-NN是干什么的 简单来说,K-NN可以看成:有那么一堆你已经知道分类的数据,然后当一个新数据进入的时候,就开始跟训练数据里的每个转载 2015-06-30 22:32:10 · 1473 阅读 · 0 评论 -
人工智能-模式识别-机器学习-计算机视觉-----大牛博客地址及主要网站汇总
之前就想着整理下,但总是惰性使然,,今天专门抽出时间来整理,近半年挖掘的大牛博客。 伟大的牛顿说过,如果说我比别人看得远,那是因为我站在了巨人的肩上,这句意味深长的话放在知识爆炸,工业4.0,平行的杂乱无章,新旧更替很快的当下,应该说是最适合不过了。。 导师之前嘱托过,看文献要看大牛的,博客更是要看大牛的。首先,大牛的博客就是在保证准确性的前提下,特别深奥难理解的知识也能讲解的。。。不知原创 2015-04-16 14:20:09 · 2211 阅读 · 0 评论 -
史上最强算法论战:请不要嘻哈,这是哈希
转自:http://mp.weixin.qq.com/s?__biz=MjM5MTQzNzU2NA==&mid=207841440&idx=1&sn=e7c993bfdd5d39de9c24a6730f78ce5e&scene=2&ptlang=2052&ADUIN=2253485857&ADSESSION=1435464260&ADTAG=CLIENT.QQ.5419_.0&ADPUBNO=26转载 2015-06-28 15:53:04 · 2702 阅读 · 0 评论 -
会议
CVPR5 http://www.pamitc.org/cvpr15/program.phpECCV2014 Accepted paperhttp://blog.youkuaiyun.com/u013476464/article/details/31383245 ECCV2014 Accepted paper http://blog.youkuaiyun.com/xiaoj原创 2015-06-28 09:39:05 · 742 阅读 · 0 评论 -
SVM样本训练步骤
SVM样本训练步骤转自:http://blog.youkuaiyun.com/xw20084898/article/details/213898851、引言近期在做飞形体目标识别的研究,需要做SVM训练来生成识别的分类器。从网上找了大量的参考文章,但是发现很多文章都讲的比较零散。鉴于此原因,本文对SVM训练过程做一个较为系统的总结,希望对广大初学者有所帮助。2、步骤(1)生成SVM描述转载 2015-06-27 09:21:04 · 10269 阅读 · 0 评论 -
最小均方算法(LMS Algorithm)理论及DSP实现
转自:http://blog.youkuaiyun.com/xiahouzuoxin/article/details/9749689Nonlinear model must applied The least-squares Minimization Algorithm, 最小二乘最小化LMS算法可认为是机器学习里面最基本也比较有用的算法,神经网络中对参数的学习使用的就是LMS的思想,在通转载 2015-06-27 19:32:40 · 2259 阅读 · 0 评论 -
从卡尔曼滤波到粒子滤波 很详细,很明了。。
转自http://blog.youkuaiyun.com/karen99/article/details/7771743卡尔曼滤波本来是控制系统课上学的,当时就没学明白,也蒙混过关了,以为以后也不用再见到它了,可惜没这么容易,后来学计算机视觉和图像处理,发现用它的地方更多了,没办法的时候只好耐心学习和理解了。一直很想把学习的过程记录一下,让大家少走弯路,可惜总也没时间和机会,直到今天。。。我一转载 2015-06-24 11:19:51 · 30271 阅读 · 10 评论 -
统计学中及计算机视觉中的各种 距离 汇总。。。
首先说一下距离三要素: 1)非负性;2)对称性;3)三角不等式。(PS:有些距离并不能同时满足)集中一下都有啥距离:L1距离,L2距离(欧式距离),L∞距离,欧氏距离平方(squared Euclidean distance),intersection distance, Kullback-Leibler(K-L)距离,Jeffrey距离,χ2距离,巴氏距离,Consine原创 2015-04-17 19:05:43 · 7237 阅读 · 0 评论 -
相关性、平均值、标准差、相关系数、回归线及最小二乘法
相关性线性相关数据在一条直线附近波动,则变量间是线性相关非线性相关数据在一条曲线附近波动,则变量间是非线性相关不相关数据在图中没有显示任何关系,则不相关 平均值N个数据 的平均值计算公式: 标准差标准差表示了所有数据与平均值的平均距离,表示了数据的散度,如果标准差小,表示数据集中在平均值附近,如果标准差大则表示数据离标准差比转载 2014-12-27 21:29:20 · 8109 阅读 · 0 评论