18、嵌入空间与多智能体网络的知识迁移学习

嵌入空间与多智能体网络的知识迁移学习

1. 嵌入空间的持续概念学习

在持续学习场景中,随着学习任务的推进,遗忘效应可能会逐渐增强。ECLA(持续概念学习算法)能够最小化相关误差的上界,使得模型可以学习并记住特定的概念表示,从而在旧领域上实现概念的泛化且避免遗忘。

1.1 实验验证

为了验证该方法的有效性,我们在两组顺序学习任务上进行了实验,分别是置换MNIST任务和数字识别任务,这些都是顺序任务学习的标准基准分类任务。

1.1.1 学习置换MNIST任务

置换MNIST任务是用于测试AI算法克服灾难性遗忘能力的标准基准。该任务的顺序任务通过对MNIST数字识别数据集的像素值进行固定随机洗牌生成。与以往的工作不同,我们的学习设置仅对初始MNIST任务的数据进行完全标记,后续任务仅标记少量数据点。

为了进行对比,我们选择了以下几种方法:
- 经典反向传播(BP)单任务学习。
- 全经验回放(FR),使用所有先前任务的完整存储数据。
- 使用完全标记数据的学习,类似于使用CLEER算法。

我们使用标准随机梯度下降来学习任务,并通过计算模型在当前和过去学习任务的标准测试分割上的性能来创建学习曲线。

对比方法 特点
BP 用于展示我们的方法能够解决灾难性遗忘问题
FR
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值