
机器学习
文章平均质量分 87
Jxiepc
一个努力向上的男同志
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
深度学习 | pytorch数据集加载
数据加载1、为何在模型中使用数据加载器在前面的线性回归模型中,我们使用的数据很少,所以直接把全部数据放到模型中去使用。但是在深度学习中,数据量通常是都非常多,非常大的,如此大量的数据,不可能一次性的在模型中进行向前的计算和反向传播,经常我们会对整个数据进行随机的打乱顺序,把数据处理成一个个的batch,同时还会对数据进行预处理。2、数据集类2.1 Dataset基类介绍通常继承torch.until.data.Dataset实现对数据集的加载。class Dataset(objec原创 2022-02-05 10:00:54 · 1551 阅读 · 0 评论 -
机器学习 | 【03】逻辑回归
文章目录一、逻辑回归1、介绍1.1 应用场景1.2 原理2、损失和优化3、API3.1 使用案例4、分类评估方法4.1 精确率和召回率4.1.2 混淆矩阵4.1.3 精确率和召回率4.1.4 F1-score4.1.5 API5、ROC曲线与AUC指标5.1 TPR与FPR5.2 ROC曲线5.3 AUC指标5.3.1 API一、逻辑回归1、介绍是机器学习的一种分类模型,一种分类算法【二分类】。1.1 应用场景广告点击率是否为垃圾邮件是否患病金融诈骗虚假账号1.2 原理原创 2021-10-11 21:02:27 · 400 阅读 · 0 评论 -
机器学习 | 【05】聚类算法
文章目录聚类算法1、简介1.1 应用2、API简介3、实现流程3.1 聚类步骤聚类算法1、简介使用不同的聚类准则,产生的聚类结果不同。一种典型的无监督学习的算法,主要用于将相似的样本自动归到一个类别上;常用欧式距离算法。1.1 应用用户画像,广告推荐,Data Segmentation,搜索引擎的流量推荐,恶意流量识别;基于位置信息的商业推送,新闻聚类,筛选排序;图像分割,降维,识别;离群点检测;信用卡异常消费;发掘相同功能的基因片段。2、API简介sklearn.cl原创 2021-08-16 15:26:39 · 294 阅读 · 0 评论 -
机器学习 | 【05】集成学习
文章目录一、继承学习1、简介2、boosting和Bagging2.1 boosting2.2 Bagging2.3 随机森林构造过程2.4 boosting与bagging的区别3、API4、GBDT一、继承学习1、简介原理:生成多个分类器/模型,各自独立学习并做出预测。在将这个预测组合,因此优于任何一个单分类的做出预测。2、boosting和Bagging2.1 boosting随着学习的积累从弱到强,每新加入一个弱学习器,整体能力就会得到提升;解决欠拟合使用boosting逐步增原创 2021-08-12 13:28:42 · 892 阅读 · 0 评论 -
机器学习入门 | 【02】线性回归
一、线性回归1、简介1.1 应用场景房价预测销售额度预测货款额度预测1.2 定义定义:利用回归方程对一个或多个自变量(特征)和因变量(目标值)之间关系进行建模;特点:一个自变量为变量回归,多个自变量为多元回归;1.3 线性回归的特征与目标的关系分析具有线性和非线性关系。1.3.1 线性关系单变量线性关系多变量线性关系1.3.2 非线性关系2、线性回归API2.1 APIsklearn.linear_model.LinearRegression()原创 2021-08-02 21:14:24 · 1377 阅读 · 4 评论 -
机器学习入门 | 【01】K近邻算法
文章目录1、K近邻算法【通过你的邻居来判断你的类别】1、简介2、电影案例分析3、api的初步使用3.1 一般的流程:3.2 sklearn模块介绍3.3 API的使用3.4 距离度量3.4.1 欧式距离【前面已提到】3.4.2 曼哈顿距离3.4.3 切比雪夫距离3.4.4 闵可夫斯基距离【一组距离的定义】3.4.5 标准欧式距离3.4.6 余弦距离3.4.7汉明距离3.4.8 杰卡德距离3.4.9 马氏距离1、K近邻算法【通过你的邻居来判断你的类别】1、简介定义:若一个样本在特征空间中的k个最相似(原创 2021-07-31 15:31:44 · 616 阅读 · 0 评论 -
机器学习 | 【02】sklearn鸢尾花案例
文章目录介绍流程代码演示1、获取数据2、基本数据处理3、特征工程4、模型评估完整代码介绍本次数据来源于sklearn中的load_iris,是一个较为简单的模型训练。适合刚入门的小伙伴练练手。了解一下整体流程。流程- 获取数据- 基本数据处理- 特征工程- 模型评估代码演示1、获取数据我们使用sklearn,datasets可获取到许多该模块中自带的数据集,可以用来练习。本次选用load_iris。2、基本数据处理我们将数据分为训练集和测试集。根据源码中的注释以及案原创 2021-05-24 08:36:31 · 653 阅读 · 0 评论 -
深度学习 | 【05】常见优化算法
常见优化算法1、梯度下降算法(batch gradient descent BGD)每次迭代都需要把所有样本都送入,这样的好处是每次迭代都顾及了全部的样本,做的是全局最优化。2、随机梯度下降法(Stochastic gradient descent SGD)针对梯度下降算法训练速度过慢的缺点,提出了随机梯度下降算法,随机梯度下降算法算法是从样本中随机抽出一组,训练后按梯度更新一次,然后再抽取一组,再更新一次,在样本量及其大的情况下,可能不用训练完所有的样本就可以获得一个损失值在可接受范围之内的原创 2021-05-17 09:20:32 · 209 阅读 · 1 评论 -
深度学习 | 【04】Pytorch实现简单的线性回归
常用API1、nn.Module原创 2021-05-16 12:08:32 · 247 阅读 · 1 评论 -
深度学习 | 【03】梯度下降法
文章目录梯度下降和方向传播1、 什么是梯度2、 偏导的计算2.1 常见的导数计算2.2 多元函数求偏导3、方向传播算法3.1 计算图和反向传播4、神经网络中的方向传播4.1 神经网络的示意图4.2 神经网络的计算图5、pytorch中实现5.1 向前计算5.2 梯度计算线性回归实现梯度下降和方向传播1、 什么是梯度是一个向量,导数+变化最快的方向(学习的前进方向)即多元函数参数的变化趋势。机器学习收集数据x,构建机器学习模型f,得到 f(x, w) = 预测值判断模型好坏的方法:los原创 2021-05-15 21:06:46 · 1005 阅读 · 2 评论 -
深度学习 | 【02】Pytorch初步使用
文章目录Pytorch初始使用1、Tensor2、Pytorch如何创建张量2.1 创建张量2.2 tensor与ndarray的关系2.3 常用api常用方法4、数据类型4.1 获取数据类型5、tensor的其他操作5.1 相加5.2 tensor与数字的操作6、CUDA中的tensorPytorch初始使用1、TensorTensor(张量是一个统称,其中包括很多类型):0阶张量:标量、常数、0-D Tensor;1阶张量:向量、1-D Tensor;2阶张量:矩阵、2-D Tensor原创 2021-05-14 20:24:30 · 1058 阅读 · 18 评论 -
深度学习 | 【01】初步介绍
文章目录一、深度学习介绍1、概念2、机器学习与深度学习的区别2.1 特征提取2.2 数据量3、应用场景4、常见深度学习框架神经网络介绍1、人工神经网络概念2、神经元概念3、单层神经网络4、感知机作用:5、多层神经网络5.1一、深度学习介绍1、概念机器学习的一个分支,是一种以人工神经网络为架构,对数据进行特征学习的算法。2、机器学习与深度学习的区别2.1 特征提取机器学习需要有人工的特征提取过程;深度学习可以通过深度神经网络自动完成。2.2 数据量深度学习需要大量的训练数原创 2021-05-14 10:29:43 · 309 阅读 · 1 评论 -
机器学习 | 【01】sklearn初步使用及机器学习的流程
文章目录sklearnscikit-learn数据集`sklearn.datasets`:加载获取流行数据集`sklearn`大数据集`sklearn`数据集返回值介绍查看数据分布seaborn数据集划分api交叉验证概念目的api机器学习基本流程特征预处理归一化标准化sklearnscikit-learn数据集sklearn.datasets:加载获取流行数据集datasets.load_*():获取小规模数据集,数据包含在datasets里datasets.fetch_*(data_home原创 2021-02-08 16:29:16 · 3021 阅读 · 1 评论