
机器学习
鲑鱼683
这个作者很懒,什么都没留下…
展开
-
sklearn学习——递归特征消除法(RFE)
sklearn——递归特征消除法(RFE)1 作用消除特征之间的冗余,选取最优特征组合。降低特征维数。2 步骤将筛选的k个特征作为初始特征子集输入到随机森林分类器中,计算得到每个特征的重要性,并利用交叉验证方法得到初始特征子集的分类精度;从当前特征子集中移除特征重要性最低的一个特征,得到一个新的特征子集,再次输入到随机森林分类器中,计算新的特征子集中每个特征的重要性,并利用交叉验证方法得到新的特征子集的分类精度。递归的重复步骤2,直至特征子集为空,最后一共得到k个不同特征数量的特征子集,原创 2021-05-11 21:03:09 · 38439 阅读 · 23 评论 -
粒子群优化支持向量机代码(PSO-SVM)
粒子群优化支持向量机代码import pandas as pdimport numpy as npimport randomfrom sklearn.svm import SVCimport matplotlib.pyplot as pltfrom sklearn.model_selection import cross_val_predictfrom sklearn.metrics import confusion_matrixfrom sklearn.preprocessing impo原创 2021-05-11 20:31:13 · 8136 阅读 · 20 评论 -
sklearn学习——特征处理
sklearn学习——特征处理特征提取(feature extraction):从文字,图像,声音等其他非结构化数据中提取新信息作为特征。比如说,从淘宝宝贝的名称中提取出产品类别,产品颜色,是否是网红产品等等。特征创造(feature creation):把现有特征进行组合,或互相计算,得到新的特征。比如说,我们有一列特征是速度,一列特征是距离,我们就可以通过让两列相处,创造新的特征:通过距离所花的时间。特征选择(feature selection):从所有的特征中,选择出有意义,对模型有帮助的原创 2020-09-22 22:14:50 · 605 阅读 · 0 评论 -
sklearn学习——数据预处理
sklearn学习——数据预处理模块:sklearn.preprocessing1 数据归一化处理归一化之后的数据服从正态分布,公式如下:在sklearn当中,我们使用preprocessing.MinMaxScaler来实现这个功能。MinMaxScaler有一个重要参数,feature_range,控制我们希望把数据压缩到的范围,默认是[0,1]。代码:# 导入库from sklearn.preprocessing import MinMaxScalerimport pandas as原创 2020-09-17 11:47:53 · 746 阅读 · 0 评论 -
sklearn学习——随机森林分类和回归
sklearn学习——随机森林分类和回归1 分类class sklearn.ensemble.RandomForestClassifier (n_estimators=’10’, criterion=’gini’, max_depth=None,min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=’auto’,max_leaf_nodes=None, min_impurity_decr原创 2020-09-14 21:53:04 · 2490 阅读 · 0 评论 -
sklearn学习——决策树回归
sklearn学习——决策树回归1 数据集采用采用波士顿房价数据集,下载地址使用sklearn.datasets.load_boston即可加载相关数据。该数据集是一个回归问题。每个类的观察值数量是均等的,共有 506 个观察,13 个输入变量和1个输出变量2 配置环境conda install scilit-learnconda install numpyconda install matplotlib3 代码from sklearn.datasets import load_bos原创 2020-07-26 21:54:37 · 592 阅读 · 0 评论 -
sklearn学习——决策树分类
sklearn学习——决策树分类1 数据集采用红酒数据集load_wine,下载地址共有13个特征,样本标签三个2 配置环境在anaconda配置环境conda install scilit-learnconda install pandasconda install numpyconda install python-graphvizconda install matplotlib3 代码from sklearn import tree #导入需要的原创 2020-07-16 22:26:28 · 1188 阅读 · 0 评论 -
sklearn学习——支持向量机分类
基于python中sklearn库支持向量机多分类代码1 数据集制作小编看过很多关于支持向量机代码的博客,全是都带有自己数据集 像Iris.data,那么怎么把自己的数据给用上呢?1.1 、如图,这是自己需要使用的数据集,ABCD表示数据的特征,E表示样本,分别为0,1,2三种不同的标签,现在我们的任务是通过训练支持向量机模型,从而通过已有的数据特征,来识别样本类型1.2、文件-另存为-选择csv文件格式1.3 后续可以把444.csv后缀改成txt,这两种都可以使用,我下面使用的是txt,如原创 2020-07-14 21:53:18 · 3394 阅读 · 3 评论