
机器学习
文章平均质量分 65
謝堆堆DDD
这个作者很懒,什么都没留下…
展开
-
机器学习01
这里写目录标题机器学习特征工程特征提取特征预处理特征降维机器学习算法分类监督学习定义:非监督学习定义:有监督,无监督算法对比:半监督学习定义:强化学习模型评估分类模型评估回归模型评估欠拟合过拟合Matplotlib、Numpy、PandasMatplotlibNumpyPandas机器学习机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。特征工程特征提取将任意数据(如文本或图像)转换为可用于机器学习的数字特征特征预处理通过一些转换函数将特征数据转换成更加适合算法模型的特征数原创 2021-07-29 20:49:30 · 1015 阅读 · 0 评论 -
机器学习day02
分类算法1. sklearn转换器和预估器转换器 特征工程的步骤: 1、实例化 (实例化的是一个转换器类(Transformer)) 2、调用fit_transform(对于文档建立分类词频矩阵,不能同时调用) 我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式 fit_transform fit() 计算每一列的平均值、标准差 transform() (x-mean)/std的最终计算(标准化)估计器估计器(estimator)1原创 2021-03-26 16:46:10 · 178 阅读 · 0 评论 -
机器学习day03
回归与聚类1.线性回归回归问题:目标值是连续型的数值线性关系一定是线性模型,线性模型不一定是线性关系线性回归的损失和优化原理:损失函数优化方法:正规方程----直接求到最好的结果 梯度下降----试错、改进线性回归APIsklearn.linear_model.LinearRegression(fit_intercept=True)sklearn.linear_model.SGDRegressor(loss="squared_loss", fit_intercept=Tru原创 2021-03-29 20:01:27 · 170 阅读 · 0 评论 -
机器学习day01
数据集可用数据集Kaggle网址:https://www.kaggle.com/datasetsUCI数据集网址: http://archive.ics.uci.edu/ml/scikit-learn网址:http://scikit-learn.org/stable/datasets/index.html#datasets原创 2021-03-22 18:45:03 · 182 阅读 · 0 评论 -
机器学习概述
机器学习算法分类监督学习目标值:类别—分类问题(猫还是狗?)算法:k-近邻法、贝叶斯分类、决策树与随机森林、逻辑回归目标值:连续型的数据----回归问题(房屋价格预测)算法:线性回归、岭回归无监督学习目标值:无—无监督学习(没有目标值)聚类k-means机器学习开发流程任务:分析很多的数据分析具体的业务应用常见的算法特征工程、调参数、优化...原创 2021-03-22 16:01:54 · 96 阅读 · 0 评论