消融实验（ablation study）

最新推荐文章于 2025-01-04 02:48:20 发布

原创最新推荐文章于 2025-01-04 02:48:20 发布 · 2.2k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #人工智能

Tools 同时被 2 个专栏收录

17 篇文章

订阅专栏

14 篇文章

订阅专栏

消融实验(AblationStudy)用于在模型改进中验证各个组件的效果。当添加模块A和B后模型性能提升，但需通过单独添加A和B来确认两者独立贡献。如果实验1和实验3效果相同或更好，表明模块B无显著作用；否则，A和B都可能有贡献。这是一种确保每个改进都有效的方法。

消融实验主要就是为了控制变量。

比如说你为了提升baseline的性能，给它加了两个模块A,B，加完之后效果果然提高了很多。于是你急急忙忙开始写论文，写到你的贡献，你给了两条：1.模块A，2.模块B。

但是这样写有个问题：尽管AB同时加上去对模型有提升效果，但是你并没有证明A、B两个模块分别都是有意义的。

所以为了验证A、B两个模块是不是真的都有用，你需要做ablation study。方法也很简单：

在baseline的基础上加上模块A，看效果。
在baseline的基础上加上模块B，看效果。
在baseline的基础上同时加上模块AB，看效果。

然后结果可能是，实验1和实验2的结果都不如实验3，那么说明AB都是有用的；然而也有可能你会发现实验1的结果和实验3一样，甚至更好。这就说明你的想法是有问题的，模块B其实并没有起到作用，提升只来自于模块A。

综上所述，ablation study就是你在同时提出多个思路提升某个模型的时候，为了验证这几个思路分别都是有效的，做的控制变量实验的工作。

引用参考：

消融实验（ablation study）_春水煎茶的博客-优快云博客消融实验主要就是为了控制变量。比如说你为了提升baseline的性能，给它加了两个模块A,B，加完之后效果果然提高了很多。于是你急急忙忙开始写论文，写到你的贡献，你给了两条：1.模块A，2.模块B。但是这样写有个问题：尽管AB同时加上去对模型有提升效果，但是你并没有证明A、B两个模块分别都是有意义的。所以为了验证A、B两个模块是不是真的都有用，你需要做ablation study。方法也很简单：在baseline的基础上加上模块A，看效果。...https://blog.youkuaiyun.com/weixin_44065652/article/details/123527844

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。