Lp范数与数据拟合

最新推荐文章于 2025-10-20 09:48:20 发布

原创最新推荐文章于 2025-10-20 09:48:20 发布 · 9.7k 阅读

·

6

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#Lp范数 #数据拟合

数据处理专栏收录该内容

1 篇文章

订阅专栏

Lp范数在数据拟合中起到关键作用，不同p值对应不同的统计特性：L0范数对应众数，L1范数对应中位数，L2范数对应平均数，而L+∞范数对应中程数。p值的选择影响对异常值的敏感度，L2范数最敏感，L1范数相对不敏感，L0范数则无感。0<p<1的范数可以在异常值处理和整体趋势间找到平衡，但计算复杂，常用于小数据、少量参数场景。

Lp范数

定义如下，p取值范围[0,+∞)

其中L0范数表示非零数据的个数

L+∞范数表示数据中的最大值

L-∞ 范数表示数据中的最小值

与数据拟合的关系

数据拟合中，通常说通过Lp范数最小化求解，是指yi的p次方和作为损失函数（无需再开p次方）

损失函数最小，以求解表达式中的参数。通常取 p>=1（主要是了大数据计算方便）

实际在小数据、少量参数情况下，通过优化算法，可以实现0<p<1情况的数据拟合

以上公式只有在p=0，以及p=+∞时，才需要严格按照Lp范数的定义赋予损失函数

要理解Lp范数对数据拟合的意义，我们先考虑如下情况

p= 0 时，a 的结果为数列X的众数（由于0^0问题，此时损失函数需要按L0范数的定义写）

p= 1 时，a 的结果为数列X的 中位数

p= 2 时，a 的结果为数列X的 平均数

p=+∞时，a 的结果为数列X的 中程数（即最大数与最小数的平均值，此时损失函数需要按L+∞范数的定义写）

以上结论可以完全适用在Lp范数最小化的数据拟合上（偏差=真实数据-拟合函数预测值）

在对异常值敏感度上，某数据在偏差Lp范数总和（损失函数）中占比越大，则对结果影响越大

如p=2，异常值对应的偏差 y - f(a ,b...) （通常较大）经过平方之后，在损失函数值中占比更大

对结果的影响也更大，因此，相比L1范数求解方法，L2范数对异常值更敏感

总结，Lp范数最小化进行数据拟合时，有如下意义：

L0范数为 众数回归，对异常值无感，有0偏差最多

L1范数为 中位数回归，对异常值不敏感，有正偏差和负偏差数量相等

L2范数为 平均数回归，对异常值较敏感，有平均偏差为0

L+∞范数为中程数回归，对异常值高敏感，有最大正偏差和最小负偏差绝对值相等

对于p等于其它数，其结果和对异常值的敏感性将介于以上两者其间

如L0.5范数最小化数据拟合，应是融合中位数和众数的一种回归，对异常值敏感性也介于不敏感和无感之间

0<p<1 的范数最小化数据拟合，能进一步降低异常值影响（相对于L1范数），同时把握整体规律，不至于陷入局部众数的影响（相对于L0范数），并在两者之间取得一个平衡。当然，其缺点也是有的，比如计算复杂、容易局部最优等，因此在实际应用中并不常见。

参考资料

https://blog.youkuaiyun.com/tiandijun/article/details/50380538

https://www.zhihu.com/question/46664595

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。