LEARNING TO LEARN WITHOUT FORGETTING BY MAXIMIZING TRANSFER AND MINIMIZING INTERFERENCE

UnknownBody

于 2024-06-14 14:59:42 发布

阅读量220

点赞数 2

CC 4.0 BY-SA版权

分类专栏： LLM Daily Model Forgetting 文章标签：语言模型人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c_cpp_csharp/article/details/139677204

LLM Daily 同时被 2 个专栏收录

1385 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

Model Forgetting

13 篇文章

订阅专栏

本文是LLM系列文章，针对《LEARNING TO LEARN WITHOUT FORGETTING BY MAXIMIZING TRANSFER AND MINIMIZING INTERFERENCE》的翻译。

通过最大限度地转移和最小化干扰来学习不遗忘

摘要
1 解决持续学习问题
2 持续学习的迁移-干扰权衡
3 一个学会不忘学习的系统
4 监督式终身持续学习的评价
5 持续强化学习的评价
6 方法的进一步分析
7 结论

摘要

在将神经网络学习扩展到更符合人类实际的环境中时，在数据的非平稳分布上的连续学习方面缺乏性能仍然是一个主要挑战。在这项工作中，我们根据转移和干扰之间的时间对称权衡，提出了连续学习问题的新概念，可以通过在示例之间强制梯度对齐来优化。然后，我们提出了一种新的算法，即元体验回放（MER），通过将体验回放与基于优化的元学习相结合，直接利用这一观点。这种方法学习的参数使基于未来梯度的干扰可能性更小，而基于未来梯度转移的可能性更大。我们在连续终身监督学习基准和非平稳强化学习环境中进行了实验，证明我们的方法始终优于最近提出的连续学习基准。我们的实验表明，随着环境变得越来越不稳定，以及存储的总经验的比例越来越小，MER算法和基线算法之间的性能差距越来越大。

1 解决持续学习问题

2 持续学习的迁移-干扰权衡

3 一个学会不忘学习的系统

4 监督式终身持续学习的评价

5 持续强化学习的评价

6 方法的进一步分析

7 结论

在这篇文章中，我们从迁移和干扰之间的基本权衡的角度，对持续学

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。