L1，L2范数学习笔记

最新推荐文章于 2021-11-22 17:51:58 发布

原创最新推荐文章于 2021-11-22 17:51:58 发布 · 475 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#范数 #数学 #线性代数

差不多数学专栏收录该内容

12 篇文章

订阅专栏

L1范数

作用：使解变为一个稀疏解，降低过拟合。

为什么会参产生稀疏解

参考https://zhuanlan.zhihu.com/p/129024068

因为在0处可能是极小点（可能性受惩罚系数影响），因此容易收敛到极小点，也就是0处，产生稀疏。

为什么稀疏解可以降低过拟合

在特征很多，或者模型很复杂，但训练数据很少时，程序很容易因为训练过度而过拟合，通过稀疏，参数中为0的位非常多，这些位对应的特征是不起作用的，起作用的只有少数非0位的特征。起到了特征选择的作用，去除了一些无用特征或噪声特征。

L2范数

作用：同样有降低过拟合的作用，并使导数曲线更平滑。

如何降低过拟合

限制多项式中某些分量的影响，从而降低对数据扰动的敏感。

为什么参数会变小（为什么会获得很小的参数解）

参考了https://blog.youkuaiyun.com/jinping_shi/article/details/52433975

每次迭代，参数都会先乘以一个小于1的系数，因此会不断衰减。

有关L1、L2的讨论

惩罚系数：

L1：系数越大，得到的解越稀疏

L2：系数越大，得到的解越小，但不稀疏。

原因：L1在损失函数的导数中会产生减一个常数，一直迭代会减到0，因此会稀疏.而L2中，会多乘一个小于1的因子，因此会平滑，但不会变0.

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。