
机器学习
文章平均质量分 55
asd8705
这个作者很懒,什么都没留下…
展开
-
Unsupervised Embedding Learning via Invariant and SpreadingInstance Feature
没有摘要原创 2022-09-05 11:04:05 · 271 阅读 · 0 评论 -
Python下的LibSVM的使用
毋庸置疑,LibSVM是台湾牛人为世界机器学习的卓越贡献之一。一般都是基于Matlab的,其实LibSVM也可以用Python跑。 第一步,确定本机Python的版本: 32位的最易配置,哈哈,我的机器就是这么的古董。64位的童鞋请Google。 第二步,到官网http://www.csie.ntu.edu.tw/~cjlin/libsvm/,来下载LibSVM转载 2016-07-20 22:46:47 · 626 阅读 · 0 评论 -
分类算法需要准备的
自助法bootstrapROC曲线Bagging原创 2016-07-16 22:24:26 · 327 阅读 · 0 评论 -
组合分类器
装袋、提升和随机森林都是组合分类方法的例子。组合分类把k个学习得到的模型(或基分类器)M1、M2,...,Mk组合在一起,旨在创建一个改进的复合分类模型M*。装袋(Bagging) 有放回的抽样,训练k个模型,然后对分类样本进行投票表决。提升(boosting) 在提升方法中,权重赋予每个训练元组。迭代地学习k个分类器。学习得到分类器Mi之后,更新权重,使得其后原创 2016-07-26 16:21:06 · 2001 阅读 · 0 评论 -
L2范数归一化
原文地址:http://blog.youkuaiyun.com/geekmanong/article/details/51344732转载 2016-07-25 13:18:14 · 1688 阅读 · 0 评论 -
反向传播神经网络极简入门
原文地址:http://www.hankcs.com/ml/back-propagation-neural-network.html我一直在找一份简明的神经网络入门,然而在中文圈里并没有找到。直到我看到了这份162行的Python实现,以及对应的油管视频之后,我才觉得这就是我需要的极简入门资料。这份极简入门笔记不需要突触的图片做装饰,也不需要赘述神经网络的发展历史;要推导有推导,要代码有代转载 2015-11-11 14:39:42 · 900 阅读 · 0 评论 -
聚类算法总结
原文地址:http://blog.chinaunix.net/uid-10289334-id-3758310.html聚类算法总结:---------------------------------------------------------聚类算法的种类:基于划分聚类算法(partition clustering)k-means:是一种典型的划分聚转载 2015-09-18 09:15:24 · 419 阅读 · 0 评论 -
Latent Semantic Analysis(LSA/ LSI)算法简介
本文地址为:http://www.cnblogs.com/kemaswill/,作者联系方式为kemaswill@163.com,转载请注明出处。 1. 传统向量空间模型的缺陷 向量空间模型是信息检索中最常用的检索方法,其检索过程是,将文档集D中的所有文档和查询都表示成以单词为特征的向量,特征值为每个单词的TF-IDF 值,然后使用向量空间模型(亦即计算查询q的向量和每个转载 2015-09-16 15:01:26 · 527 阅读 · 0 评论 -
向量空间模型(VSM)在文档相似度计算上的简单介绍
原文地址:http://blog.youkuaiyun.com/felomeng/article/details/4024078C#实现在:http://blog.youkuaiyun.com/Felomeng/archive/2009/03/25/4023990.aspx向量空间模型(VSM:Vector space model)是最常用的相似度计算模型,在自然语言处理中有着广泛的应转载 2015-09-16 14:56:56 · 830 阅读 · 0 评论 -
PLSI( probabilistic latent semantic indexing ) 词分类,文档分类
原文地址:http://www.cnblogs.com/25-to-life/archive/2011/03/05/1971492.htmlLSA对于许多搞IR和NLP的来说应该不陌生吧,LSA用SVD降维,然后来根据word distribution,来分类文档而LSA的劣势在于,没有比较好的统计基础,这个和当前流行趋势是不相符的。所以PLSA,用概率模型来做转载 2015-09-16 15:14:58 · 529 阅读 · 0 评论 -
pca 特征抽取
原文地址:http://blog.youkuaiyun.com/aalbertini/article/details/6256656主成分分析 ( Principal Component Analysis , PCA )是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间。给定 n 个变量的 m转载 2015-09-15 20:27:34 · 640 阅读 · 0 评论 -
机器学习资料
机器学习自学指南 http://blog.jobbole.com/58937/原创 2015-05-05 19:42:53 · 350 阅读 · 0 评论