《Dropping Networks for Transfer Learning》结论

最新推荐文章于 2022-03-11 21:43:11 发布

原创最新推荐文章于 2022-03-11 21:43:11 发布 · 315 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

迁移学习专栏收录该内容

7 篇文章

订阅专栏

本文总结了《DroppingNetworksforTransferLearning》的主要结论。研究指出DroppingNetworks相较于Bagging神经网络和单一神经网络有明显优势，尤其是在高dropout率下(p=0.5)。该方法通过调整单一参数γ实现有效的迁移学习，对于任务间关系紧密的情况，推荐使用较高的γ值(0.9-0.95)。文章还探讨了γ值动态调整的策略，并提出了一种加权方案来处理远距离任务的知识迁移。

《Dropping Networks for Transfer Learning》这篇文章前面看了一小部分，综合之前看过的论文，个人有个感觉就是真正的国外学者的英语确实更难一些（读起来真的是费劲，笔者的渣渣英语水平被轰成渣）。

所以这里具体内容就不写了，就写一下结论部分。

结论一共是4条：

1.相对于Bagging神经网络或单神经网络而言，Dropping网络的模型平均特性显示出显著的优势，特别是当dropout比较高的时候(p=0.5)，导致每个模型具有更高的多样性和特殊性。

2.转移的方法仅依赖于一个额外参数γ。另外,使用更高的衰减率γ(0.9 - -0.95)更适合于密切相关的任务。

3.按照与在线误差曲线拟合的平滑样条的斜率成比例减小γ，表现比任意阶跃变化或γ的固定速率更好（相当于静态硬参数集体迁移）

4.如果距离远的任务需要知识迁移，而负迁移的的可能影响没有处理的话可以忽视这部分知识。建议的加权方案考虑到了这一点，这反映在表3中，表明M + Q→S对比S + Q→M表现出最大的改善，与传递M + Q→S的表2中提出的替代方法相比表现比M→S差。

。。。就这样了，以后有机会再好好读读这篇文章。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。