- 博客(13)
- 收藏
- 关注
原创 k最近邻算法
一种非参数、惰性学习方法,导致预测时速度慢当训练样本集较大时,会导致其计算开销高样本不平衡的时候,对稀有类别的预测准确率低KNN模型的可解释性不强。
2022-07-20 16:24:02
1304
原创 K-Means 算法
数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得**评价指*标J(目标函数)**最小算法采用**误差平方和**准则函数作为聚类准则函数K-Means算法过程★算法过程如下(1)从数据集中随机选取K个数据作为初始质心,质心点不一定是数据集中的数据.(2)对剩余的每个数据测量其到每个质心的距离,并把它归到最近的质心的类.质心不变重点n_clusters。.........
2022-07-20 16:23:16
1145
原创 DBSCAN 算法
DBSCAN类的重要参数也分为两类,一类是DBSCAN算法本身的参数,一类是最近邻度量的参数epsDBSCAN算法参数,即我们的ϵ-邻域的距离阈值,和样本距离超过ϵ的样本点不在ϵ-邻域内。默认值是0.5DBSCAN算法参数,即样本点要成为核心对象所需要的ϵ-邻域的样本数阈值。默认值是5metric最近邻距离度量参数algorithm最近邻搜索算法参数,算法一共有三种,第一种是蛮力实现‘brute’,第二种是KD树实现‘kd_tree’,第三种是球树实现‘ball_tree’............
2022-07-20 16:21:59
980
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人