
sk-learn
丁叔叔
这个作者很懒,什么都没留下…
展开
-
SKlearn 通用模式
Sklearn 把所有机器学习的模式整合统一起来了,学会了一个模式就可以通吃其他不同类型的学习模式。#导入模块from sklearn import datasetsfrom sklearn.model_selection import train_test_splitfrom sklearn.neighbors import KNeighborsClassifier#创建数据#加载 ...原创 2019-04-04 16:25:41 · 266 阅读 · 0 评论 -
数据预处理
无量纲化、归一化、缺失值编码 和哑变量连续数据处理,二值化 分段原创 2019-06-09 00:34:18 · 112 阅读 · 0 评论 -
PCA程序
import matplotlib.pyplot as pltfrom sklearn.datasets import load_irisfrom sklearn.decomposition import PCAiris = load_iris()y = iris.targetX = iris.data#作为数组,X是几维?X.shape#作为数据表或特征矩阵,X是几维?imp...原创 2019-06-02 21:58:18 · 744 阅读 · 0 评论 -
python机器学习库sklearn——交叉验证(K折、留一、留p、随机)
https://blog.youkuaiyun.com/luanpeng825485697/article/details/79836262学习预测函数的参数,并在相同数据集上进行测试是一种错误的做法: 一个仅给出测试用例标签的模型将会获得极高的分数,但对于尚未出现过的数据它则无法预测出任何有用的信息。 这种情况称为 overfitting(过拟合). 为了避免这种情况,在进行(监督)机器学习实验时,通常取...原创 2019-06-02 16:27:10 · 6375 阅读 · 0 评论 -
python3 机器学习sklearn之简介
https://blog.youkuaiyun.com/hubingshabi/article/details/802016001.机器学习简介机器学习是实现人工智能的手段,其主要研究内容是如何利用数据或经验进行学习 ,改善具体算法的性能多领域交叉,涉及概率论、统计学,算法复杂度理论等多门学科广泛应用于网络搜索、垃圾邮件过滤、推荐系统、广告投放、信用评价、欺诈检测、股票交易和医疗诊断等应用2.机器学...原创 2019-05-19 20:24:13 · 214 阅读 · 0 评论 -
sklearn之线性回归
python3机器学习sklearn之线性回归https://blog.youkuaiyun.com/hubingshabi/article/details/80172608https://blog.youkuaiyun.com/hubingshabi/article/details/80181596这个主要讲了关于一个披萨 根据尺寸变化 价格产生变化的例子其中有尺寸对价格的 一元一次尺寸 材料 对价格的多元...原创 2019-05-03 08:09:05 · 151 阅读 · 0 评论 -
保存模型
我们训练好了一个Model 以后总需要保存和再次预测, 所以保存和读取我们的sklearn model也是同样重要的一步。这次主要介绍两种保存Model的模块pickle与joblib。使用 pickle 保存首先简单建立与训练一个SVCModel。from sklearn import svmfrom sklearn import datasetsclf = svm.SVC()ir...原创 2019-04-17 16:18:33 · 1658 阅读 · 0 评论 -
交叉验证 2 Cross-validation
sklearn.learning_curve 中的 learning curve 可以很直观的看出我们的 model 学习的进度, 对比发现有没有 overfitting 的问题. 然后我们可以对我们的 model 进行调整, 克服 overfitting 的问题.Learning curve 检视过拟合加载对应模块:from sklearn.learning_curve import le...原创 2019-04-17 16:18:49 · 312 阅读 · 0 评论 -
交叉验证 1 Cross-validation
Sklearn 中的 Cross Validation (交叉验证)对于我们选择正确的 Model 和 Model 的参数是非常有帮助的, 有了他的帮助,我们能直观的看出不同 Model 或者参数对结构准确度的影响。Model 基础验证法from sklearn.datasets import load_iris # iris数据集from sklearn.model_selection i...原创 2019-04-17 16:18:58 · 537 阅读 · 0 评论 -
正规化 Normalization
由于资料的偏差与跨度会影响机器学习的成效,因此正规化(标准化)数据可以提升机器学习的成效。首先由例子来讲解:数据标准化from sklearn import preprocessing #标准化数据模块import numpy as np#建立Arraya = np.array([[10, 2.7, 3.6], [-100, 5, -2], ...原创 2019-04-17 16:19:08 · 642 阅读 · 0 评论 -
sklearn 常用属性与功能
from sklearn import datasetsfrom sklearn.linear_model import LinearRegressionloaded_data = datasets.load_boston()data_X = loaded_data.datadata_y = loaded_data.targetmodel = LinearRegression()m...原创 2019-04-17 16:19:17 · 983 阅读 · 0 评论 -
Sk通用数据库
导入模块 ¶导入 datasets 包,本文以 Linear Regression 为例。from __future__ import print_functionfrom sklearn import datasetsfrom sklearn.linear_model import LinearRegressionimport matplotlib.pyplot as plt导入数...原创 2019-04-17 16:19:26 · 381 阅读 · 0 评论