
machine-learning
文章平均质量分 93
Senit_Co
这个作者很懒,什么都没留下…
展开
-
数据挖掘中的度量方法
在数据挖掘中,无论是对数据进行分类、聚类还是异常检测、关联性分析,都建立在数据之间相似性或相异性的度量基础上。通常使用距离作为数据之间相似性或相异性的度量方法,常用的度量方法有欧式距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、汉明距离、余弦距离、马氏距离、Jaccard系数、相关系数、信息熵。 欧式距离 nn维空间中两个样本点xx和yy之间的欧几里得距离定义如下: d(x,y)=Σnk=原创 2017-12-02 22:20:13 · 2143 阅读 · 0 评论 -
机器学习算法之数据降维
原文站点:https://senitco.github.io/2017/05/10/data-dimensionality-reduction/ 数据降维是通过某种数学变换将原始高维属性空间,转变为一个低维子空间,对数据进行降维,可以有效地去除样本中冗余的属性,减少数据容量,缓解维数灾难,加快学习速度。数据降维的常用方法有主成分分析(PCA)、多维缩放(MDS)、线性判别分析(LDA)、等度量映射原创 2017-12-02 09:36:12 · 4738 阅读 · 0 评论