相当于是在小于1的部分使用2范数(更smooth,且求导方便),在大于1的部分使用1范数(避免梯度爆炸,同时减少outlier的影响)
smooth_L1个人理解
最新推荐文章于 2025-05-27 01:29:25 发布
相当于是在小于1的部分使用2范数(更smooth,且求导方便),在大于1的部分使用1范数(避免梯度爆炸,同时减少outlier的影响)