
算法
wangdi_37927
这个作者很懒,什么都没留下…
展开
-
KNN分类原理
原文链接:https://zhuanlan.zhihu.com/p/22345658kNN 可以用来进行分类或者回归,大致方法基本相同,本篇文章将主要介绍使用 kNN 进行分类。K:邻居数量1.距离函数:最常用L2距离,即欧氏距离。标准化:要对距离标准化(归一化)2.概率KNN定义:可有时我们并不想知道一个确切地分类,而想知道它属于某个分类的概率是多大。这只兔...原创 2020-01-04 16:00:55 · 438 阅读 · 0 评论 -
数据挖掘导论笔记1——第二章:数据
鲁棒算法--有噪声也可以产生可接受的结果。使用【特征、变量】替代【属性】。数据预处理1.特征子集选择2.特征提取:由原始数据创建新的特征集。3.特征构造:由一个或者多个原始特征构造新的特征。4.二元化5.非监督离散化6.监督离散化...原创 2018-06-03 17:20:13 · 1017 阅读 · 0 评论 -
数据挖掘导论笔记2--第3章:探索数据
名词解释:1.多元汇总统计(协方差矩阵、相关性矩阵):2.百分位数图、经验累积分布图3.平行坐标系为了避免线交叉太多,图形变得模糊不清,要将交叉多的那个属性放在最左边。4.维归约、转轴5.上卷和下钻与聚集的区别6....原创 2018-06-09 14:26:39 · 510 阅读 · 1 评论 -
Python: sklearn库中数据预处理函数fit_transform()和transform()的区别
原帖:https://blog.youkuaiyun.com/quiet_girl/article/details/72517053敲《Python机器学习及实践》上的code的时候,对于数据预处理中涉及到的fit_transform()函数和transform()函数之间的区别很模糊,查阅了很多资料,这里整理一下: 涉及到这两个函数的代码如下: # 从sklearn.pre...转载 2018-07-21 16:34:45 · 2088 阅读 · 0 评论