11、机器学习中的数学基础与数据处理

rust6ferris

于 2025-08-06 09:56:24 发布

阅读量28

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习的数学与架构文章标签：机器学习数学基础凸函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/rust6ferris/article/details/151236044

深度学习的数学与架构专栏收录该内容

42 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

机器学习中的数学基础与数据处理

1. 凸函数与非凸函数及局部、全局最小值

凸函数特性 ：凸函数只有全局最小值，没有局部最小值。如图3.15所示，沿着梯度下降必定能到达全局最小值。例如，代码示例如下：

print('The solution via gradient descent is {}'.format(solution_gd))

输出结果：

The solution via gradient descent is [ 1.0766 0.8976 -0.9581]

无论在凸函数表面的哪个位置，只要持续沿着梯度向下移动，最终都会达到全局最小值。
- 非凸函数问题 ：非凸函数存在局部最小值，如图3.16所示。从某个点沿着梯度下降可能会陷入局部最小值，此时梯度为零，就无法再移动到其他位置。过去，研究人员花费大量精力避免局部最小值，开发了如模拟退火等特殊技术。但神经网络通常不会采取特殊措施处理局部最小值和非凸函数，因为局部最小值往往也足够好，或者可以从不同随机点重新训练，幸运地避开局部最小值。
- 训练与推理 ：训练后得到一个估计的输出函数 ( f(\vec{x}) ) ，其权重能使训练数据集上的误差最小化。之后就可以将分类器投入使用，输入任意向量 ( \vec{x} ) ，计算 ( f(\vec{x}) ) 并做出决策，

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。