
数据挖掘
Cakymy
harder and better
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
K-Means算法
K-Means算法属于聚类算法的一种。聚类算法是根据样本之间的相似性,将样本划分到不同的类别中。K-Means算法主要步骤可以分为三步: 1.初始化常数k,随机选取k个点作为质心 2.计算样本与每个质心之间的相似度,将样本归类到最相似的质心中。再次计算质心,直到质心不再改变 3.输出最终的质心以及每个类 原始数据集: 实际上,k-means的本质是最小化目标函数,此处目标函数为每个点到其簇质心...原创 2019-03-14 13:43:18 · 517 阅读 · 0 评论 -
KNN分类器
K-Nearest Neighbor 在训练数据中寻找与测试数据最相似的K个数据,再让这K个数据对测试数据进行投票,最后把票数最高的标签作为对测试图片的预测。 1.数据集的处理 下载地址:官网下载地址 对训练集进行的处理: import pickle import numpy as np def down_load(filename): with open(filename,'rb') ...原创 2019-03-13 15:34:38 · 428 阅读 · 0 评论