
美国数学大学生建模竞赛记录
文章平均质量分 68
newsunson
这个作者很懒,什么都没留下…
展开
-
python支持向量机SVM (sklearn)
python支持向量机SVM (sklearn)文章目录python支持向量机SVM (sklearn)原理概述代码导入库生成数据集核心代码线性不可分的情况核函数重要参数C(软间隔和硬间隔)混淆矩阵小案例多分类原理概述说实话以前用支持向量机都是直接套进去的,不过现在看了看菜菜提供数学原理发现其实挺有意思(是超有意思!!)。此处就不详述了,这原理到处都是。反正这文SVM和决策树一样,有支持向量分类(SVC)和支持向量回归(SVR)。代码下面是一个SVC的案例导入库from sklearn.dat原创 2021-02-02 17:05:22 · 1039 阅读 · 4 评论 -
sklearn聚类算法Kmeans
sklearn聚类算法Kmeans菜菜的sklearn学习笔记文章目录sklearn聚类算法Kmeans概述案例数据生成聚类类的质心聚类的评估可视化分成4类会怎么样概述聚类算法是一种无监督学习算法,也就是说它不需要标签,只需要大量的特征就可以把数据集聚类,然后聚类在自己给他贴标签。 这里Kmeans的具体原理不作详述。案例数据生成通过sklearn自带的make_blobs函数可以生成聚类所需的数据集,注意,所生成的数据集是几个分簇。from sklearn.datasets import原创 2021-02-01 16:46:17 · 687 阅读 · 0 评论 -
sklearn主成分分析PCA
sklearn主成分分析PCA菜菜的sklearn学习笔记数学原理给数学基础不是很好的看PCA主要用于降维,比如一个人有身高,年龄,样貌,性别,智力,耐力,速度,成绩等等很多特征,每种特征便是一个维度。假如你觉得描述一个人的特征太多,你想要用一两个或几个特征就个以描述一个人,并且这几个特征包含之前提到所有特征所包含的信息,将这么原来的众多特征转化为几个特征的过程就是降维。而降维后得到的特征包含的信息量的多少也叫做贡献率,信息量越多越能够反应本质。代码这里举一个最常用的水仙花的例子导入包包括s原创 2021-02-01 12:40:45 · 753 阅读 · 0 评论 -
sklearn数据预处理和特征工程
sklearn数据预处理和特征工程本文基于菜菜的机器学习文章目录sklearn数据预处理和特征工程数据预处理数据的无量纲化归一化标准化标准化和归一化如何选择填补缺失值编码二值化和分段二值化分段数据预处理数据的无量纲化一般来说,当我们将数据导入模型的时候,无量纲化的可以帮我们去除量纲对模型的影响(决策树和随机森林不需要这样做,它可以处理大多数数据)一般来说线性的无量纲化包括去中心化和缩放处理,中心化就是将原本的数据通过加减一个固定值使他进行平移,缩放就是对数据乘除一个固定值使其处于某一种范围之中,原创 2021-01-30 21:34:21 · 207 阅读 · 2 评论 -
基于sklearn的随机森林实现
sklearn随机森林本文基于菜菜的sklearn教学文章目录sklearn随机森林随机森林分类器概述引入包导入数据划分测试集和训练集核心代码特征重要性预测交叉验证参数讲解随机森林回归案例分析基础代码调参结语随机森林分类器概述随机森林是一种集成算法,即运用大量不同的算法,选出最优的一个,主要是基于决策树。引入包from sklearn.tree import DecisionTreeClassifierfrom sklearn.ensemble import RandomForestClas原创 2021-01-30 19:03:10 · 499 阅读 · 1 评论 -
seaborn入门(6)PairGrid
seaborn入门(6)PairGridPairGrid二代码和图(载入数据有问题看seaborn入门(1))import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsiris = sns.load_dataset(name='iris',cache=True,data_home="./seaborn-data")iris_g = sns.PairGrid(iris,hue原创 2021-01-30 00:13:34 · 513 阅读 · 0 评论 -
seaborn入门(5)群图(cluster map)
seaborn入门(5)群图(cluster map)群图(cluster map)二话不多说先给代码和图(载入数据有问题看seaborn入门(1))import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsiris = sns.load_dataset(name='iris',cache=True,data_home="./seaborn-data")species =原创 2021-01-30 00:03:45 · 3505 阅读 · 1 评论 -
seaborn入门(4)关联系数矩阵和热力图
seaborn入门(4)关联系数矩阵文章目录seaborn入门(4)关联系数矩阵关联系数矩阵热力图关联系数矩阵这个懂的都懂,大概就是表示两个变量之间的关联性。tips_mx = tips_df.corr()print(tips_df.corr())得到如下结果热力图我们可以将上面的矩阵可视化sns.heatmap(tips_mx,annot = True , cmap = 'Blues')其中得到...原创 2021-01-29 23:25:39 · 1033 阅读 · 0 评论 -
seaborn入门(3)调色盘
seaborn入门(3)基础准备如果不太懂建议看seaborn入门(1)和seaborn入门(2)import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snstips_df = sns.load_dataset(name='tips',cache=True,data_home="./seaborn-data")sns.set_style('dark')sns.set_con原创 2021-01-29 23:02:15 · 212 阅读 · 0 评论 -
seaborn入门(2)继续展示seaborn的各种绘图效果
seaborn入门(2)文章目录seaborn入门(2)准备数据集设置风格简单设置图中元素柱状图计数图准备数据集需要提前下载数据集,详情见[seaborn入门(1)]import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snstips_df = sns.load_dataset(name='tips',cache=True,data_home="./seaborn-data"原创 2021-01-29 22:37:24 · 284 阅读 · 0 评论 -
seaborn入门(1)展示seaborn的各种绘图效果
seaborn入门(1)展示seaborn的各种绘图效果文章目录seaborn入门(1)展示seaborn的各种绘图效果导入包载入数据集画图简单展示几种绘图方式displot()kdeplot()jointplot()pairplot()rugplot()导入包import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns载入数据集以下代码可以查看seaborn自带的数据集原创 2021-01-29 20:00:36 · 1092 阅读 · 1 评论 -
基于sklearn的决策树实现
sklearn本文基于菜菜的机器学习教程。文章目录sklearn决策树参数表示数据预处理分离特征(x)与标签(y)划分训练集与测试集建立模型基础代码交叉验证调参可视化决策树参数表示决策树中有参数如下:DecisionTreeClassifier(criterion="gini" , splitter="best" , max_depth=None , min_samples_split=2原创 2021-01-25 18:40:45 · 448 阅读 · 2 评论