Machine Learning
文章平均质量分 53
yysunlife
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
熵、信息增益
如果分类的输入原创 2014-07-17 22:54:17 · 979 阅读 · 0 评论 -
从协方差矩阵到PCA
协方差就是这样一种用来度量两个随机变量关系的统计量转载 2014-09-03 09:43:45 · 2716 阅读 · 0 评论 -
SVD奇异值分解
the columns of U are the eigenvectors of the AAT matrix and the columns of V are the eigenvectors of the ATA matrix. VT is the transpose of V and S is a diagonal matrix. By definition the nondiago转载 2014-09-03 15:33:50 · 767 阅读 · 0 评论 -
查普曼-科莫高洛夫方程Chapman–Kolmogorov equation
p(y | x) = f原创 2014-08-07 22:42:54 · 12360 阅读 · 2 评论 -
数学之美笔记2
某个网页与某个查询的相关性=查询中的关键词原创 2014-09-10 20:55:12 · 565 阅读 · 0 评论 -
矩阵求导
Y = A * X --> DY/DX = A'Y = X * A --> DY/DX = AY = A' * X * B --> DY/DX = A * B'Y = A' * X' * B --> DY/DX = B * A' 于是把以前学过的矩阵求导部分整理一下:1. 矩阵Y对标量x求导: 相当于每个元素求导数后转置一下,注意M×N矩阵求导后变成N×M了转载 2014-07-21 10:40:37 · 996 阅读 · 0 评论 -
逻辑回归LR的特征为什么要先离散化
在工业界,很少直接将连续值作为特征喂给逻辑回归模型,而是将连续特征离散化为一系列0、1特征交给逻辑回归模型,这样做的优势有以下几点:1. 稀疏向量内积乘法运算速度快,计算结果方便存储,容易scalable(扩展)。2. 离散化后的特征对异常数据有很强的鲁棒性:比如一个特征是年龄>30是1,否则0。如果特征没有离散化,一个异常数据“年龄300岁”会给模型造成很大的干扰。3.原创 2014-09-22 16:26:19 · 27797 阅读 · 6 评论 -
2014年百度机器学习岗位笔试题
3算法题:1)求两个已经排好序的中位数,吗,2原创 2014-09-21 21:40:22 · 1521 阅读 · 0 评论 -
数学之美笔记1
不同的文字系统在记录信息上的能力是等价d原创 2014-09-07 22:51:51 · 945 阅读 · 0 评论 -
最大似然和EM算法
机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人做不了的事。那么EM算法能解决什么问题呢?或者说EM算法是因为什么而来到这个世界上,还吸引了那么多世人的目光。 我希望自己能通俗地把它理解或者说明白,但是,EM这个问题感觉真的不太好用通俗的语言去说明白,转载 2014-09-04 11:43:52 · 942 阅读 · 0 评论 -
半监督学习
目前,国内的南京大学周志华老师是这方面的泰斗,写了很多这方面牛的文章,可以参考一下他的主页:http://cs.nju.edu.cn/zhouzh/。。下面贴出来的文章出自周老师之手,通俗易懂。受益匪浅。。1. 引言 在传统的监督学习中,学习器通过对大量有标记的(labeled)训练例进行学习,从而建立模型用于预测未见示例的标记。这里的“标记”(label)是指示例所对应转载 2014-07-24 22:07:37 · 771 阅读 · 0 评论 -
VC维
VC维详细的解释:http://www.svms.org/vc-dimension/原创 2014-07-23 10:27:36 · 1010 阅读 · 0 评论 -
判别模型与生成模型的区别
一、决策函数Y=f(X)或者条件概率分布P(Y|X) 监督学习的任务就是从数据中学习一个模型(也叫分类器),应用这一模型,对给定的输入X预测相应的输出Y。这个模型的一般形式为决策函数Y=f(X)或者条件概率分布P(Y|X)。 决策函数Y=f(X):你输入一个X,它就输出一个Y,这个Y与一个阈值比较,根据比较结果判定X属于哪个类别。例如两类(w1和w2)分类问转载 2014-07-22 11:05:01 · 857 阅读 · 0 评论 -
停用词stopWord
先看维基百科的解释:原创 2014-07-20 16:18:47 · 2695 阅读 · 0 评论 -
向量表示,投影,协方差矩阵,PCA
引言当面对的数据被抽象为一组向量,那么有必要研究一些向量的数学性质。而这些数学性质将成为PCA的理论基础。理论描述向量运算即:内积。首先,定义两个维数相同的向量的内积为:(a1,a2,⋯,an)T⋅(b1,b2,⋯,bn)T=a1b1+a2b2+⋯+anbn内积运算将两个向量映射为一个实数。其计算方式非常容易理解,但是其意义并不明显。所以,我们分转载 2014-11-19 22:50:14 · 7304 阅读 · 1 评论
分享