
Data Analysis
LuLuLee
这个作者很懒,什么都没留下…
展开
-
数据降维
第十讲. 降维——Dimensionality Reduction===============================(一)、为什么要降维?(二)、主成分分析Principal Component Analysis (PCA) (三)、PCA 算法流程(四)、从压缩数据中恢复原数据(五)、怎样决定降维个数/主成分个数转载 2013-12-08 11:35:55 · 1140 阅读 · 0 评论 -
Karhunen-Loeve Transform (KLT) 原理及PCA应用
Karhunen-Loeve Transform(KLT)是一种数据变换与分析方式,常用于数据压缩和PCA降维。1. KLT是什么变换,KLT的目的是什么?KLT是对向量x做的一个正交变换y=Φx,目的是变换到y后去除数据相关性。PS:其中,Φ是x特征向量组成的矩阵,满足ΦTΦ=I,当x都是实数时,Φ是正交矩阵。转载 2013-12-09 13:53:52 · 820 阅读 · 0 评论 -
Large-Scale Frequent Sequence Mining
Mind the Gap: Large-Scale Frequent Sequence Mining(注意间隙:大规模频繁序列挖掘)摘要频繁数据挖掘是数据挖掘中一个基本部分。并且该问题已经得到了广泛的研究,一些可用的技术扩展处理数以百亿级的数据集;这种大规模数据集的增长,比如,在文本挖掘和会话分析。在本文中,我们提出了MG-FSM,一种可扩展性算法利用MapReduce处理频繁序列挖掘翻译 2013-12-09 15:42:13 · 1183 阅读 · 0 评论 -
准确率与召回率
在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。准确率、召回率、F1信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(Precision Rate),召回率也叫查全率,准确率也叫查准率,概念公式: 召回率(Recall) =转载 2014-10-06 14:00:15 · 559 阅读 · 0 评论