
数据挖掘和分析
不停---
吹皱一池春水
buting.site
展开
-
KNNRegression
#一般来说,KNeighbors分类器有两个重要参数:邻居个数与数据点之间的距离的度量方法。#在实践中一般选取较小的邻居个数(比如3到5个)#邻居个数与数据点之间的距离方法 默认使用欧式距离#KNN算法 预测速度较慢 且不能处理具有多个数据特征的数据集 因此在实践中很少使用#用于回归的k近邻算法在sklearn的kneighborregressor类中实现,其用法与kneighborcl...原创 2020-03-05 10:06:28 · 1672 阅读 · 0 评论 -
基于sklearn package 的KNN实现
#将数据分为测试集和训练集from sklearn.model_selection import train_test_splitX,y=mglearn.datasets.make_forge()X_train,X_test,y_train,y_test=train_test_split(X,y,random_state=0)#拟合from sklearn.neighbors impor...原创 2020-03-04 14:38:12 · 214 阅读 · 0 评论 -
鸢尾花数据集KNN分类模型
1.数据读入from sklearn import datasetsiris_dataset=datasets.load_iris()print("Keys of iris_dataset:\n{}".format(iris_dataset.keys()))2.数据分析from sklearn.model_selection import train_test_splitX_train...原创 2020-02-29 17:24:23 · 1392 阅读 · 0 评论 -
基本库的使用 2.29
1.numpy and scipyimport scipy as simport numpy as npx=np.array([[1,2,3],[4,5,6]])print("x:\n{}".format(x))from scipy import sparseeye=np.eye(4)print("nparray:\n{}".format(eye))sparse_matrix=sp...原创 2020-02-29 17:02:38 · 130 阅读 · 0 评论 -
数据的加载和存储--2.29
1.文本文件读取1.读取csv文件pd.read_csv(filepath,sep=',',header='infor'...)2.读取文本文件pd.read_table(filepath,sep='\t',header='infor'....)常用参数:参数名称说明filepath文件路径,无默认值sep分割符。csv默认“,”,table默认“\t"...原创 2020-02-29 15:46:03 · 229 阅读 · 0 评论