
机器学习
文章平均质量分 91
机器学习的概念和算法理论以及Python代码实践操作
少云清
纸上得来终觉浅,绝知此事要躬行
展开
-
机器学习_18_主题模型
主题模型(Topic Model)是自然语言处理中的一种常用模型,它用于从大量文档中自动提取主题信息。主题模型的核心思想是,每篇文档都可以看作是多个主题的混合,而每个主题则由一组词构成。原创 2024-02-04 18:58:56 · 773 阅读 · 0 评论 -
机器学习_17_隐马尔可夫模型
马尔可夫决策过程是基于马尔可夫过程理论的随机动态系统的最优决策过程。马尔可夫决策过程是序贯决策的主要研究领域。它是马尔可夫过程与确定性的动态规划相结合的产物,故又称马尔可夫型随机动态规划,属于运筹学中数学规划的一个分支原创 2024-02-04 18:56:05 · 825 阅读 · 0 评论 -
机器学习_16_EM算法
EM算法(Expectation Maximization Algorithm, 最大期望算法)是一种迭代类型的算法,是一种在概率模型中寻找参数最大似然估计或者最大后验估计的算法, 其中概率模型依赖于无法观测的隐藏变量。原创 2024-02-04 18:54:19 · 800 阅读 · 0 评论 -
机器学习_15_贝叶斯算法
朴素贝叶斯(Naive Bayes, NB)是基于“**特征之间是独立的**”这一朴素假设,应用贝叶斯定理的监督学习算法原创 2024-02-03 17:04:45 · 1462 阅读 · 1 评论 -
机器学习_14_多分类及多标签分类算法
单标签多分类问题其实是指待预测的label标签只有一个,但是label标签的取值可能有多种情况;直白来讲就是每个实例的可能类别有K种(t1,t2,...tk,k≥3);常见算法:Softmax、KNN、决策树等;原创 2024-02-03 16:45:26 · 1655 阅读 · 0 评论 -
机器学习_13_SVM支持向量机、感知器模型
支持向量机(Support Vecor Machine, SVM)本身是一个**二元分类算法**,是对感知器算法模型的一种扩展,现在的SVM算法支持**线性分类**和**非线性分类**的分类应用,并且也能够直接将SVM应用于**回归应用**中,同时通过OvR或者OvO的方式我们也可以将SVM应用在**多元分类**领域中。在不考虑集成学习算法,不考虑特定的数据集的时候,在分类算法中SVM可以说是特别优秀的。原创 2024-02-02 23:34:59 · 1381 阅读 · 0 评论 -
机器学习_12_梯度下降法、拉格朗日、KKT
机器学习的梯度下降算法和调优策略以及约束条件原创 2024-02-02 22:59:03 · 1587 阅读 · 0 评论 -
机器学习_11_聚类算法
聚类就是对大量未知标注的数据集,按照数据内部存在的数据特征将数据集划分为多个不同的类别,使类别内的数据比较相似,类别之间的数据相似度比较小;属于无监督学习原创 2023-11-15 21:15:28 · 990 阅读 · 0 评论 -
机器学习_10_集成学习方法:随机森林、Boosting
集成学习通过建立几个模型组合的来解决单一预测问题。它的工作原理是生成多个分类器/模型,各自独立地学习和作出预测。这些预测最后结合成单预测,因此优于任何一个单分类的做出预测。原创 2023-10-21 21:03:36 · 1113 阅读 · 1 评论 -
机器学习_9_分类算法—决策树
决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构建决策树来进行分析的一种方式,是一种直观应用概率分析的一种图解法;决策树是一种预测模型,代表的是对象属性与对象值之间的映射关系;决策树是一种树形结构,其中每个内部节点表示一个属性的测试,每个分支表示一个测试输出,每个叶节点代表一种类别;决策树是一种非常常用的有监督的分类算法。原创 2023-09-29 20:16:07 · 2404 阅读 · 2 评论 -
机器学习_8_分类算法-k近邻算法(KNN)
K近邻(K-nearst neighbors,KNN)是一种基本的机器学习算法,所谓k近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。比如:判断一个人的人品,只需要观察与他来往最密切的几个人的人品好坏就可以得出,即“近朱者赤,近墨者黑";KNN算法既可以应用于分类应用中,也可以应用在回归应用中。原创 2023-08-23 21:34:41 · 987 阅读 · 0 评论 -
机器学习_7_分类算法—逻辑回归
线性回归的式子作为输入判断某一类别的概率(根据数据大小作出判断)应用场景:二分类问题(哪一个类别少,判定的概率值是指的这个类别。)返回的是概率值原创 2023-08-03 21:09:41 · 1000 阅读 · 1 评论 -
机器学习_6_回归算法 —欠拟合、过拟合原因及解决方法
过拟合:一个假设在训练数据上能够获得比其他假设更好的拟合, 但是在训练数据外的数据集上却不能很好地拟合数据,此时认为这个假设出现了过拟合的现象。(模型过于复杂)欠拟合:一个假设在训练数据上不能获得更好的拟合, 但是在训练数据外的数据集上也不能很好地拟合数据,此时认为这个假设出现了欠拟合的现象。(模型过于简单)原创 2023-07-26 15:09:26 · 827 阅读 · 0 评论 -
机器学习_5_普通最小二乘法线性回归案例(Scikit-learn 0.18.2)
现有一批描述家庭用电情况的数据,对数据进行算法模型预测,并最终得到预测模型(每天各个时间段和功率之间的关系、功率与电流之间的关系等)原创 2023-06-13 10:52:14 · 667 阅读 · 0 评论 -
机器学习_4_回归算法(算法原理推导+实践)和 梯度下降算法
线性回归通过一个或者多个自变量与因变量之间之间进行建模的回归分析。其中特点为一个或多个称为回归系数的模型参数的线性组合。原创 2023-05-30 12:02:37 · 1069 阅读 · 0 评论 -
机器学习_3_机器学习数学基础知识
机器学习的梯度下降算法、偏导数、概率、线性代数原创 2023-05-07 23:29:53 · 611 阅读 · 2 评论 -
机器学习_2_机器学习基础—算法分类、模型调优
机器学习算法分类、模型调优原创 2023-04-03 16:16:20 · 396 阅读 · 0 评论 -
机器学习_1_机器学习概述—全流程
机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测原创 2023-03-03 21:48:57 · 1665 阅读 · 2 评论 -
如何把数据集划分成训练集和测试集
如何把数据集划分成训练集和测试集转载 2022-02-06 17:52:52 · 7108 阅读 · 0 评论