
sklearn
醉小义
学习算法让自己有更大的提升
展开
-
机器学习之sklearn回归--01
# coding=utf-8import pandas as pdimport matplotlib.pyplot as pltimport numpy as npfrom sklearn.preprocessing import labelfrom sklearn.linear_model import LogisticRegressionfrom sklearn.metric...原创 2018-05-11 09:04:39 · 543 阅读 · 0 评论 -
sklearn库中数据预处理函数fit_transform()和transform()的区别--01
# coding=utf-8from sklearn import preprocessingimport numpy as npfrom sklearn.preprocessing import StandardScaler''' StandardScaler 类 预处理对象 fit() 预处理的数据,计算矩阵列均值和...原创 2018-05-04 21:39:31 · 13458 阅读 · 5 评论 -
统计学方差,中位数,方差,标准差,协方差等的计算
# coding=utf-8import numpy as npimport pandas as pddatas = [98,83,65,72,79,76,75,94,91,77,63,83,89,69,64,78,63,86,91,72,71,72,70,80,65,70,62,74,71,76]#平均数aver = np.mean(datas)#中位数mid = np...原创 2018-05-04 21:46:35 · 10541 阅读 · 2 评论 -
Sklearn-preprocessing.scale/StandardScaler/MinMaxScaler--02
标准化数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。这样去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。其中最典型的就是0-1标准化和Z标准化0-1标准化(0-1 normalization)也叫离差标准化,是对原始数据的线性变换,使结果落到[0,1]区间,转换函数如下:其中max为样本数据的最大值,min为样本数...转载 2018-05-04 21:48:59 · 1173 阅读 · 0 评论 -
sklearn中digits手写字体数据集介绍
1. 导入from sklearn import datasetsdigits = datasets.load_digits()122. 属性查看digits: bunch类型print digits.keys()['images', 'data', 'target_names', 'DESCR', 'target']1233. 具体数据1797个样本,每个样本包括8*8像素的图像和一个[0...转载 2018-05-27 12:35:41 · 5814 阅读 · 3 评论