
机器学习
文章平均质量分 95
从基础到高级,深度讲解机器学习理论
为梦而生~
Python新星创作者,优快云潜力新星,阿里云社区专家博主。我在学习的是算法和机器学习、深度学习的相关内容,欢迎大家来与我探讨交流,一起进步!在我的博客中,你可以找到我对于某些知识点的理解和经验分享,也欢迎与我交流和讨论编程相关的话题。谢谢你的光临!
展开
-
【机器学习基础】层次聚类-BIRCH聚类
BIRCH算法的优势包括对大型数据集的高效处理能力、低内存消耗以及对噪声数据和离群点的鲁棒性。通过灵活地调整参数,可以控制聚类的紧密度和数量,在处理大规模数据时表现出色。原创 2024-03-02 09:21:15 · 2466 阅读 · 63 评论 -
【机器学习基础】一元线性回归(适合初学者的保姆级文章)
一元线性回归是一种统计分析方法,用于建立一个自变量和一个因变量之间的线性关系模型。在一元线性回归中,只有一个自变量(即解释变量)与一个因变量(即被解释变量)相关。原创 2024-02-25 10:34:20 · 2809 阅读 · 45 评论 -
【机器学习基础】正则化
如果我们有非常多的特征,我们通过学习得到的假设可能能够非常好地适应训练集(代价函数可能几乎为 0),但是可能会不能推广到新的数据。原创 2024-02-21 09:08:54 · 2339 阅读 · 53 评论 -
【机器学习基础】决策树(Decision Tree)
决策树是一种树形结构,用于描述从一组数据中提取出一些特征,并通过这些特征来进行分类或预测的过程。决策树的每个节点表示一个特征,每个分支表示这个特征的一个取值,叶子节点表示最终的分类结果。原创 2024-02-17 09:47:28 · 2225 阅读 · 39 评论 -
【机器学习 & 深度学习】卷积神经网络简述
卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习(deep learning)的代表算法之一。卷积神经网络具有表征学习(representation learning)能力,能够按其阶层结构对输入信息进行平移不变分类(shift-invariant classification),因此也被称为“平移不变人工神经网络(Shift-Invariant Artificial Neural Networks, SIANN)”原创 2024-01-31 08:00:00 · 1991 阅读 · 11 评论 -
【机器学习 & 深度学习】神经网络简述
神经网络是一种模拟生物神经系统的信息处理模型,由多个神经元组成。这些神经元通过连接传递信号,并按照一定的权重进行加权求和,最终输出一个结果。神经网络的学习过程是通过不断调整神经元之间的连接权重来实现的,使得神经网络能够更好地适应不同的输入数据。原创 2024-01-27 16:29:30 · 2116 阅读 · 13 评论 -
【机器学习基础】集成学习
集成学习(Ensemble Learning)是一种通过结合多个弱分类器的预测结果,来得到一个更强大的分类器的方法。它基于“群体智慧”,通过对多个模型结果的综合,可以缓解过度拟合和欠拟合等问题,并提升预测性能。常见的集成学习算法包括 Boosting、Bagging、随机森林等。其中,Boosting 是一种将多个弱分类器变成强分类器的算法,Bagging 是一种基于 Bootstrap 取样的集成学习算法,随机森林则是一种结合决策树和 Bagging 的方法。集成学习在机器学习和数据挖掘领域有着广泛的应原创 2024-01-11 13:35:40 · 1320 阅读 · 12 评论 -
【机器学习基础】支持向量机
支持向量机(Support Vector Machine,SVM)是一种按监督学习方式对数据进行二元分类的广义线性分类器。其决策边界是对学习样本求解的最大边距超平面。SVM使用铰链损失函数计算经验风险并在求解系统中加入了正则化项以优化结构风险,是一个具有稀疏性和稳健性的分类器。SVM可以通过核方法进行非线性分类,是常见的核学习方法之一。原创 2024-01-08 09:44:19 · 1298 阅读 · 10 评论 -
【机器学习基础】DBSCAN
基于密度的聚类算法是以出格合适对不确定命据集举行聚类,不用计较各种各样的距离,而是基于密度,就可以迅速的完成样本集的聚类。它从一个随机的没有经过访问的一个对象点开始进行搜索,并检查对象点的E邻域是否含有至少minpts个对象,如果它附近点的数量少于minpts,那么该点将会暂时标记为噪声点,如果附近点的数目大于等于minpts,那么该对象点会创建一个新的簇,并将把该点和它的E邻域内的所有对象全部放入列为候选集合。噪声点被识别为选择对象过程的一部分,如果特定的对象点没有足够的附近点,则将其标记为噪声点。原创 2024-01-04 22:10:45 · 1302 阅读 · 3 评论 -
【机器学习基础】K-Means聚类算法
聚类分析是一种典型的无监督学习, 用于对未知类别的样本进行划分,将它们按照一定的规则划分成若干个类族,把相似(距高相近)的样本聚在同一个类簇中, 把不相似的样本分为不同类簇,从而揭示样本之间内在的性质以及相互之间的联系规律原创 2023-11-20 16:12:35 · 1161 阅读 · 1 评论 -
【机器学习基础】对数几率回归(logistic回归)
对数几率回归,也称为逻辑回归,是一种广义线性模型。在逻辑回归中,通过使用sigmoid函数,将线性回归的输出映射到0和1之间,表示样本属于某一类的概率。所以它属于分类模型。逻辑回归模型的训练通常通过最大化似然函数来完成,常用的解决方法是使用梯度下降算法进行模型优化,通过迭代调整模型参数,使得模型的预测结果逐渐接近实际标签。逻辑回归可以表示为一个关于θ的函数hθ(x),即hθ(x) = P(y=1|x;θ),表示给定特征x和参数θ的条件下,样本属于正例的概率。原创 2023-11-17 16:02:12 · 2502 阅读 · 0 评论 -
【机器学习基础】多元线性回归(适合初学者的保姆级文章)
多元线性回归是一种统计分析方法,它涉及到两个或更多的自变量,并且因变量和自变量之间是线性关系。这种方法用于确定两个或更多个变量之间的定量关系。多元线性回归模型表示因变量(Y)与自变量(X1,X2,X3等)之间的线性关系。承接我们上一篇文章预测房价的例子目前为止,我们探讨了单变量线性回归模型,现在我们对房价模型增加更多的特征,例如房间的数量,楼层数和房屋的年龄等,构成一个含有多变量的模型,模型中的特征为(x1,x2,…,xn)。增添更多特征后,看一下各个变量名n 代表特征的数量xix^{(i)}x。原创 2023-11-15 21:33:29 · 7435 阅读 · 2 评论 -
【机器学习基础】机器学习的模型评估(评估方法及性能度量原理及主要公式)
机器学习模型评估是机器学习领域中的一个重要研究方向,其研究背景在于随着大数据时代的到来,人们面临着越来越多的数据分析和处理任务,而机器学习作为一种高效的数据处理技术,在很多领域都得到了广泛应用。然而,机器学习模型的效果评估是机器学习应用过程中一个非常关键的问题,因此机器学习模型评估的研究具有非常重要的意义。原创 2023-11-14 16:16:40 · 15984 阅读 · 0 评论 -
【机器学习基础】机器学习的基本术语
介绍了模型、训练数据、过拟合、欠拟合等14个基本术语,应有尽有,赶紧来学习吧!原创 2023-11-14 12:48:39 · 1549 阅读 · 0 评论 -
【机器学习基础】机器学习入门(1)
监督学习(Supervised Learning):在这种学习方法中,算法从带有标签的训练数据中学习。标签是指我们已知的“答案”。例如,如果我们要预测房价,我们可能会用—套房屋特征(如面积、卧室数量等)和相应的价格(标签)来训练模型。—旦模型被训练好,我们可以用它来预测新房屋的价格。无监督学习(Unsupervised Learning):在这种方法中,算法只有输入数据,没有任何标签。其目标通常是找到数据中的结构或模式。原创 2023-11-13 15:21:21 · 778 阅读 · 2 评论 -
【机器学习基础】机器学习入门(2)
1. 监督学习:利用训练集数据对其进行训练得到相应的正确对应关系,从而测试集数据在得到的对应关系下进行运算得到相应的正确结果。在监督学习中,对于数据集的每个样本,我们用算法预测并得出正确答案。监督学习可分为回归问题和分类问题。回归问题预测连续值的输出,分类问题预测离散值的输出。2. **无监督学习**:数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。无监督学习的数据集没有标签或具有相同的标签,算法自动对数据集处理分类。总的来说,监督学习和无监督学习的主要区别在于是否利用标签进行训练和原创 2023-11-13 19:53:18 · 649 阅读 · 1 评论