
机器学习
文章平均质量分 85
太阳是白的
这个作者很懒,什么都没留下…
展开
-
机器学习-集成学习LightGBM
LightGBM 是微软开发的一个强大的开源梯度提升框架。它旨在高效和可扩展,能够处理大型数据集和高维特征。LightGBM结合使用基于梯度的单边采样(GOSS)和独占特征捆绑(EFB)来降低计算成本并提高模型的准确性。LightGBM 支持各种目标函数,可用于回归和分类问题。它还提供了一些高级功能,例如提前停止、交叉验证和超参数调整,以帮助用户构建稳健的模型。此外,它还为流行的编程语言(如 Python、R 和 C++)提供接口,使其易于集成到现有的数据科学工作流程中。原创 2023-02-21 10:07:07 · 2196 阅读 · 0 评论 -
机器学习-集成学习XGBoost
XGBoost (eXtreme Gradient Boosting) 是一种流行的机器学习算法,用于解决各种预测问题,例如分类、回归和排名。在本文中,我们将介绍 XGBoost 的基本原理、常见的应用和一些实践经验.原创 2023-02-20 11:46:38 · 894 阅读 · 0 评论 -
机器学习-集成学习GBDT
GBDT(Gradient Boosting Decision Trees)是一种基于决策树的集成学习算法,它通过逐步地训练多个决策树模型来提高预测性能。具体来说,GBDT采用加法模型(additive model)的思想,每次训练一个新的决策树来拟合残差(预测误差),然后将所有决策树的预测结果相加作为最终的预测值。GBDT算法虽然能够自适应地学习特征交互关系,但它仍然需要依赖人工选择或构造特征。在实际应用中,我们需要结合特征工程技术来提取更有用的特征,从而进一步提高模型的性能。原创 2023-02-17 09:47:59 · 353 阅读 · 0 评论 -
机器学习-随机森林
随机森林(Random Forest)是一种基于决策树的集成学习方法,它通过构建多个决策树来提高预测准确性和稳定性。在本文中,我们将介绍随机森林的原理、优点和缺点,以及它在机器学习中的应用。原创 2023-02-16 14:00:23 · 1236 阅读 · 0 评论 -
机器学习-决策树
决策树是一种常用的机器学习算法,用于分类和回归问题。其主要思想是根据已知数据构建一棵树,通过对待分类或回归的样本进行逐步的特征判断,最终将其分类或回归至叶子节点。原创 2023-02-15 10:57:52 · 985 阅读 · 0 评论 -
机器学习-朴素贝叶斯
朴素贝叶斯是一种基于贝叶斯定理的分类算法,属于生成式模型的范畴。它的基本思想是基于贝叶斯定理和特征独立性假设。它假设每个特征之间相互独立,因此名称为“朴素”。在朴素贝叶斯分类中,我们假设给定数据点属于某个类别,可以通过对该类别中各个特征的条件概率进行乘积计算,以计算该数据点属于该类别的概率。最终,选择概率最大的类别作为该数据点的预测类别。原创 2023-02-14 08:59:08 · 449 阅读 · 0 评论 -
机器学习-SVM
SVM(支持向量机)是一种常用的机器学习算法,用于分类和回归分析。它的主要目的是寻找一个最优超平面,将不同属性的数据分成不同的类别。SVM是一种有效的分类器,因为它可以处理高维数据,并且可以使用核函数处理非线性可分的数据。原创 2023-02-13 10:56:54 · 2152 阅读 · 0 评论 -
机器学习-kmeans
K-means是一种经典的无监督学习算法,用于对数据进行聚类。K-means算法将数据集视为具有n个特征的n维空间,并尝试通过最小化簇内平方误差的总和来将数据点划分为簇。本文将介绍K-means算法的原理、实现和应用。K-means是一种无监督学习算法,用于对数据进行聚类。该算法将数据集分为K个簇,每个簇包含最接近其质心的数据点。K-means算法将数据集视为具有n个特征的n维空间,并尝试通过最小化簇内平方误差的总和来将数据点划分为簇。原创 2023-02-11 09:32:40 · 732 阅读 · 0 评论 -
机器学习-PCA
PCA(Principal Component Analysis)是一种常用的数据降维方法,它的主要思想是将高维数据降维到一个低维空间,同时保留尽可能多的原始数据的信息。PCA (Principal Component Analysis) 是一种常用的数据降维算法,用于对高维数据进行降维和特征提取。它的主要思想是通过对数据的协方差矩阵进行特征值分解,选择前 k 个特征值最大的特征向量作为新的主成分,将原始数据投影到主成分空间,从而实现数据降维。原创 2023-02-10 17:48:16 · 601 阅读 · 0 评论 -
机器学习-KNN
KNN可以说是最简单的分类算法之一,同时也是最常用的分类算法之一。KNN算法是有监督学习的分类算法,与机器学习算法Kmeans有点像,但却是有本质区别的一个样本a在特征空间中离它最近的K个最近的样本中,大多数属于某个类别,则a样本也属于这个类别如何计算其他样本与a样本的距离?一般时候我们使用欧式距离px2−x12y2−y12px2−x12y2−y12p∑i0nxi−yi2p∑i0nxi。原创 2023-02-10 13:55:04 · 183 阅读 · 0 评论 -
机器学习-逻辑回归
前言逻辑回归虽然叫回归,实际上是一个二分类模型,要知道回归模型是连续的,而分类模型是离散的,逻辑回归简单点理解就是在线性回归的基础上增加了一个 sigmoid 函数逻辑回归 = 线性回归 + sigmoid 函数回顾线性回归表达式:sigmoid 函数什么是sigmoid 函数sigmoid 是以0.5为分界线的激活函数,主要用于将结果输入sigmoid 函数中sigmoid函数会输出一个[0,1] 区间的概率值,0.5以上为一类,0.5以下为一类,这样完成二分类任务公式:逻辑回原创 2023-02-08 18:54:54 · 282 阅读 · 0 评论 -
机器学习绪论
程序通过不断的学习达到一定的性能,可以完成指定的任务定义(1)机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验 学习中改善具体算法的性能。(2)机器学习是对能通过经验自动改进的计算机算法的研究。(3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准机器学习的三个要素模型(model):模型在未进行训练前,其可能的参数是多个甚至无穷的,故可能的模型也是多个甚至无穷的,这些模型构成的集合就是假设空间。...原创 2022-08-03 13:54:47 · 296 阅读 · 0 评论 -
机器学习-线性回归
线性回归是机器学习中基础的模型之一,是有监督模型。定义:线性回归是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法表达式:$y=wx+b $θ0,θ1θ0,θ1h=θ0+θ1xh=θ0+θ1x可得[1x][1x][θ0θ1][θ0θ1]=XθX\thetaXθJ=12m∑(h−y)2J=2m1∑(h−y)2Δθ。原创 2022-10-28 19:30:19 · 166 阅读 · 0 评论