机器学习基础课程复习——（3）复杂性

最新推荐文章于 2025-12-04 22:05:42 发布

原创

最新推荐文章于 2025-12-04 22:05:42 发布 · 812 阅读

18 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #人工智能

VC维和Natarajan维

引入

对于大多数学习问题而言，学习算法所考虑的假设空间并非是有限的，因此无法直接使用假设的数目来刻画空间的复杂度。我们需要引入一种用于刻画无限假设空间的复杂度的方法——即VC维，Natarajan维以及Rademacher复杂度。

限制的定义

从定义上看，限制可以理解为多个映射构成的集合，每个映射对于同一个数据集D都会得到不同的向量值。

为方便理解，不妨设假设空间H有两个映射f1和f2，数据集D：x1，x2

f1：将x1和x2映射为了(1,-1)

f2：将x1和x2映射为了(-1,1)

则我们将f1与f2构成的集合称为假设空间H到数据集D上的限制

增长函数的定义

从定义上看，增长函数表示假设空间H到大小为m的数据集D上的限制的最大映射数目

可能有点抽象，下面我直白一点解释

即从X空间选出多个可能的集合D，其中每个集合中变量的数目都为m、

我们想要找出哪个数据集合D，假设空间H在D上限制数最多，即映射的数目最多

因此有了上面的解释，下面这句话也好理解了

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

我要吃火锅啊

关注关注

13
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

高维统计理论 Gauss与Rademacher复杂度

一个不愿透露姓名的博客

07-21

1281

对于随机过程$\{X_{\theta},\theta \in T\}$，其中$T$是随机过程的指标集，给定$\theta \in T$时，$X_{\theta}$是一个随机变量。在本篇中，我们感兴趣的问题是如何利用已知的随机过程研究指标集$T$的性质。

机器学习期末复习（1）—— 机器学习简介

starmain246的博客

07-03

854

针对于成绩较好学生的机器学习知识点复习概要，过一遍就行不用硬背。

参与评论您还未登录，请先登录后发表或查看评论

机器学习速成第一集——机器学习基础

🌟【AI炼丹师 | 你的数字技术搭子】大二解锁3200+道友同行👾

08-11

3254

机器学习基础什么是机器学习？ 机器学习的应用领域。 机器学习的主要类型：监督学习、无监督学习、半监督学习、强化学习。数学基础复习线性代数复习：向量、矩阵运算、特征值与特征向量。概率与统计复习：概率分布、期望、方差、协方差等。微积分复习：梯度、偏导数、梯度下降法等。 Python编程基础 NumPy库介绍：数组操作、数学函数等。 Pandas库介绍：数据结构（Series和DataFrame）、数据处理方法等。 Matplotlib或Seaborn库介绍：数据可视化。

机器学习【期末复习总结】——知识点和算法例题（详细整理）

热门推荐

Ax的博客

12-08

5万+

【电子科技大学、机器学习课程】（期末复习、知识点和算法例题、详细总结）

计算机保研/考研面试复习——机器学习篇

zeng699304的博客

02-10

1611

计算机保研/考研面试复习——机器学习篇

萱仔求职系列——1.1 机器学习基础知识复习

qq_44117805的博客

08-06

1336

任务类型K-means：无监督学习（聚类）。KNN：有监督学习（分类或回归）。输入K-means：只需要数据，不需要标签。KNN：需要带有标签的训练数据。输出K-means：每个样本的簇分配和质心。KNN：新样本的预测标签或值。算法目标K-means：寻找数据的自然簇，最小化簇内的样本到质心的距离。KNN：基于已知样本的标签或值，对新样本进行预测。适用场景K-means：用于发现数据的自然分组或模式，适用于数据探索和预处理。KNN：用于对新样本进行预测，适用于分类和回归任务。

机器学习——期末复习重点题归纳

frank-liang的博客

11-15

1779

机器学习期末复习

【一起啃西瓜书】机器学习-期末复习（不挂科）

风口IT猪的成长录

12-11

3万+

【机器学习-期末复习爆肝2w字笔记整理分享】《机器学习》致力于研究如何通过计算的手段，利用经验来改善系统自身的性能，从而在计算机上从数据（经验）中产生“模型”，用于对新的情况给出判断（利用此模型预测未来的一种方法）。分为三类：监督学习、元监督学习、强化学习。

【一起啃西瓜书】机器学习-期末复习

风口IT猪的成长录

12-09

1万+

吴恩达机器学习基础课程笔记

tjujackson的博客

03-06

1517

吴恩达机器学习2022笔记

NOIP初赛复习——程序设计基础.doc

05-26

NOIP初赛复习——程序设计基础详细知识点：程序设计语言是一组规则，用于定义计算机程序的语法，使得人与计算机能够交流。程序设计语言可分为低级语言和高级语言。低级语言包括机器语言和汇编语言，与特定机器相关...

精选资源

机器学习期末复习.docx

01-02

深度学习是机器学习的一个分支，它涉及构建多层的神经网络，这些网络的深度和复杂性使得它们能够解决更复杂的任务，如图像识别、自然语言处理等。【模型评估与选择】模型评估主要关注模型的泛化能力，即模型在新...

【模式识别与机器学习（8）】主要算法与技术（下篇：高级模型与集成方法）之元学习与集成方法：组合多个学习器来提高整体性能

hiliang521的博客

12-02

789

【模式识别与机器学习（8）】主要算法与技术（下篇：高级模型与集成方法）之元学习

【模式识别与机器学习（15）】机器学习算法-主成分分析

hiliang521的博客

12-02

828

【模式识别与机器学习（15）】主成分分析

当AI遇见MEMS：机器学习如何优化微振镜的控制与可靠性预测

m0_57847742的博客

12-04

974

您认为在控制优化与可靠性预测这两个方向中，哪一项的产业化落地会更快，面临的障碍更小？

用Python玩转GAN：让AI学会“造假”的艺术

2303_77568009的博客

12-03

1422

本项目基于PyTorch实现了生成对抗网络（GAN），用于生成手写数字图像。通过搭建生成器和判别器的卷积神经网络结构，采用对抗训练策略，成功在MNIST数据集上训练出能够生成逼真数字图像的模型。实践过程中解决了GPU环境配置、Windows多进程加载数据、网络优化等关键技术问题，最终实现了从随机噪声到清晰数字图像的端到端生成。该实践加深了对深度学习框架使用、模型训练调优及GAN原理的理解，为机器学习算法学习提供了完整案例。

机器学习--损失函数

weixin_57225400的博客

12-04

311

损失函数（Loss Function）是机器学习中用于衡量模型预测值与真实值之间差异的函数，是优化算法的核心目标。通过最小化损失函数，模型逐步调整参数以提高预测准确性。通过组合现有函数或设计新公式满足特定需求。加权MSE：为不同样本分配不同权重。正则化损失：加入L1/L2惩罚项防止过拟合。

正态分布：机器学习中的统计基石与高斯遗产

拒绝AI玄学，只聊真技术▲

12-01

836

正态分布不仅仅是统计学中的一个公式，它是理解随机现象的基础框架。在机器学习中，正态分布的假设虽然有时过于理想化，但它提供了强大的数学工具和直观的解释框架。然而，现实世界的数据常常偏离正态性（如金融数据中的厚尾分布），这推动了更复杂分布模型的发展，如t分布、拉普拉斯分布、广义极值分布等。此外，非参数方法（如核密度估计）和不做分布假设的机器学习算法（如随机森林、梯度提升树）也在许多场景下表现出优越性。即使面对复杂的世界，通过恰当的数学模型，我们仍然能够捕捉和利用其中的规律性。

【机器学习三大范式对比总结】