感谢商汤科技给我一次面试的机会,通过面试也暴漏了自己很多问题。 立体匹配中很多网络都是用的 smooth L1 loss。那他和L1、L2 loss的区别是什么呢? L1 loss(MAE) 其中 x 为预测框与 groud truth 之间 elementwise 的差异。 先说下L1 loss的优点: 优点:L1 的导数为常数。,无论对于什么样的输入值,都有着稳定的梯度,不会导致梯度爆炸问题,具有较为稳健性的解。如果训练数据被异常值破坏的话(也就是我们在训练环境中错误地接收到巨大的不切实际的正/负值,但在测试环境中却没有),MAE会很有用。 L1 的缺点:<