
机器学习基础知识
西红柿炒豆腐
passion 4 python
展开
-
K-fold vs. Monte Carlo cross-validation(K折交叉验证与蒙特卡洛交叉验证(MCCV))
1.K折交叉验证单次k折交叉验证每一个数据顶多作为一次测试集(因为数据划分已经固定),对k-fold交叉验证运行的结果进行平均可以得到算法性能的(几乎)无偏估计,但方差很高;想要获得更多的切分方式:N次K折交叉验证(每次进行k折交叉验证时有不同的数据划分,共K*N个模型,取平均。实现:单次k折:sklearn.model_selection -kfold多次k折:sklearn.model_selection-repeatedkfold2.MCCV蒙特卡罗交叉验证(MCCV) =重复随机子原创 2020-10-19 16:51:02 · 5598 阅读 · 2 评论 -
Building Autoencoders in Keras
目的:利用autoencoder进行降维,并尽量保留主要信息(仅针对特征),mnist数据集数据处理读取数据、归一化(仅针对特征)import matplotlib.pyplot as pltimport numpy as npfrom keras import regularizersfrom keras.datasets import mnistfrom keras.layers import Dense, Inputfrom keras.models import Modelfrom原创 2020-09-23 17:10:36 · 381 阅读 · 0 评论 -
利用BayesianOptimization库对模型进行贝叶斯调参(XGBOOST)
构建目标函数目标函数(参数优化最大化的函数):-1*mse,使用10折交叉验证,取10次的平均MSE作为最终目标函数.def xgb_cv(max_depth, learning_rate, n_estimators, min_child_weight, subsample, colsample_bytree, reg_alpha, gamma): val = cross_val_score(estimator=XGBRegressor(max_depth=int(max_depth),原创 2020-09-20 22:35:00 · 5714 阅读 · 5 评论 -
MNIST手写数字辨识
多层感知器相关库import matplotlib.pyplot as pltimport numpy as npfrom keras.datasets import mnistfrom keras.layers import Densefrom keras.models import Sequentialfrom keras.utils import np_utils加载数据file = mnist.load_data()# tuple类型# 包含训练集:特征(60000,28,2原创 2020-09-14 19:37:53 · 295 阅读 · 0 评论 -
模型评估与选择——参数、超参数、训练集、验证集、测试集
1.模型选择与评估1.1 模型参数、超参数了解什么是模型参数,什么是超参数是很必要的,不同类型的参数需要在不同的阶段进行调节(参数——训练集;超参数——验证集)模型参数:模型内部的配置变量,可以通过数据估计(学习)模型参数的值超参数:模型的外部配置变量,需要手动设置,好的超参数可以进一步提高模型的性能模型参数的特点:1.进行模型预测时需要模型参数;2.可定义模型功能;3.可使用数...原创 2020-04-04 10:39:59 · 10227 阅读 · 4 评论 -
XGBOOST模型简单调参(分类)
1.模型选择与评估1.1 模型参数、超参数了解什么是模型参数,什么是超参数是很必要的,不同类型的参数需要在不同的阶段进行调节(参数——训练集;超参数——验证集)模型参数:模型内部的配置变量,可以通过数据估计(学习)模型参数的值超参数:模型的外部配置变量,需要手动设置,好的超参数可以进一步提高模型的性能模型参数的特点:1.进行模型预测时需要模型参数;2.可定义模型功能;3.可使用数...原创 2020-04-04 00:12:09 · 3130 阅读 · 2 评论 -
Adaboost python实现
AdaBoost算法详解与python实现转载 2019-12-17 18:16:45 · 420 阅读 · 0 评论 -
利用sklearn实现adaboost,以单一分类树为例
0普通决策树0.1生成数据sklearn提供了随机数据生成的功能:make_regression 生成回归模型的数据make_multilabel_classification生成分类模型数据用make_blobs生成聚类模型数据用make_gaussian_quantiles生成分组多维正态分布的数据import matplotlib.pyplot as pltimport nu...原创 2019-12-17 09:45:48 · 613 阅读 · 0 评论 -
KNN算法python实现(鸢尾花,iris)
读取数据集import operatorimport randomimport numpy as npimport sklearn.datasets as sdfrom sklearn.metrics import classification_report, confusion_matrixfrom sklearn.model_selection import train_test...原创 2019-12-16 18:21:36 · 2164 阅读 · 2 评论 -
决策树的简单实现与可视化
0.原理略1.数据http://www.ai-xlab.com/my/course/135课时1-课程资料是CSV文件,依据已有数据推断是否买电脑数据属性:age,income,student,credit_rating标签属性:Yes/No共14笔数据2.需要的库csv,sklearn,graphviz其中graphviz需要独立安装并自行设置环境变量,否则报错:make...原创 2019-12-07 17:47:11 · 586 阅读 · 0 评论