
机器学习
文章平均质量分 93
TBest_
这个作者很懒,什么都没留下…
展开
-
使用Sklearn中线性回归(LinearRegression)模型与决策树回归(DecisionTreeRegressor)模型解决身高预测问题
综上比较,可知一般线性回归模型拟合较好,预测数据准确率高于决策树回归。统一数据,不同模型,预测效果不同,可尝试多种模型进行训练预测。线性回归假设特征与输出之间存在线性关系,并通过最小化残差平方和来拟合最优的参数。线性回归容易理解和实现,但要求特征与输出之间的关系是线性的。决策树回归基于树的叶节点上的均值或中位数来预测输出。决策树回归易于解释和理解,但容易过拟合。原创 2024-03-19 18:00:59 · 2137 阅读 · 3 评论 -
使用Sklearn中的逻辑回归(LogisticRegression)对手写数字(load_digits)数据集进行识别分类训练
如果 'return_X_y' 为 True,则 ('data', 'target') 将是 pandas DataFrames 或 Series,如下所述。==============类 每类 10 个样本 ~180 个样本 共 1797 维 64 特征 整数 0-16 ============== 这是 UCI ML 手写数字数据集测试集的副本 https:archive.ics.uci.edumldatasetsOptical+Recognition+of+Handwritten+Digits。原创 2024-03-18 22:23:19 · 3681 阅读 · 0 评论 -
使用Sklearn中‘K近邻’分类法对鸢尾花(iris)数据集进行训练分类
Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。序号属性单位1花萼长度)cm2Sepal.Width(花萼宽度)cm3Petal.Length(花瓣长度)cm4。原创 2024-03-17 23:17:58 · 3646 阅读 · 0 评论 -
利用Sklearn中逻辑回归模型训练胸腺癌(breast_cancer)数据集
是基于基于NumPySciPy和Matplotlib的开源Python机器学习包,具有:1.简单高效的数据分析工具2.可在多种环境中重复使用3.建立在NumpyScipy以及matplotlib等数据科学库之上4.开源且可商用的基于BSD许可它封装了一系列数据预处理、机器学习算法、模型选择等工具,是数据分析师首选的机器学习工具包。自2007年发布以来,已经成为Python重要的机器学习库了,简称sklearn,支持包括分类、原创 2024-03-16 12:00:43 · 3531 阅读 · 1 评论