Continual Learning with Deep Generative Replay【小白读论文】

最新推荐文章于 2024-10-09 18:19:35 发布

乌漆嘎嘎黑

最新推荐文章于 2024-10-09 18:19:35 发布

阅读量1.1k

点赞数 6

文章标签：持续学习深度学习论文笔记人工智能

本文链接：https://blog.youkuaiyun.com/qq_46127363/article/details/142383196

版权

在这里插入图片描述

摘要：
简单地重放所有以前的数据可以缓解该问题，但它需要大量内存，并且在现实世界中对过去数据的访问受到限制。提出了深度生成重放（Deep Generative Replay），由深度生成模型（“生成器”）和任务解决模型（“求解器”）。仅使用这两个模型，就可以轻松对先前任务的训练数据进行采样，并将其与新任务的训练数据交错。

在我们的深度生成重放框架中，模型通过生成的伪数据（使用GAN）的重放来保留先前获取的知识。

一些术语：
将要解决的N个任务定义为任务序列 $T = (T_1, T_2, ···, T_N )$ 。
定义 1：任务 $T_i$ 是针对数据分布 $D_i$ 的目标优化模型， $D_i$ 中的训练样本表示为 $x_i, y_i)$ 。
将我们的模型称为scholar，因为它能够学习新任务并将其知识传授给其他网络。“scholar”与集成模型的师生框架的不同，师生框架的网络仅进行教学或学习。
定义2：scholar $H$ 是一个元组 $〈 G, S 〉$ ，其中生成器 $G$ 是产生类真实样本的生成模型，求解器 $S$ 是由 $θ$ 参数化的任务求解模型。
求解器必须执行任务序列 $T$ 中的所有任务。完整目标是最小化任务序列中所有任务的无偏损失总和（所有任务的损失总和最小）
在这里插入图片描述
其中 $D$ 是整个数据分布， $L$ 是损失函数。在接受任务 $T_i$ 的训练时，模型会输入来自 $D_i$ 的样本。

所提方法：
在这里插入图片描述
图（a）一个任务对应一个scholar，训练一系列scholar模型相当于连续训练单个scholar，同时参考其最新的先前scholar。
图（b）训练新的生成器，接收当前任务输入 $x$ 和先前任务的重放输入 $x^{'}$ ，以模拟真实样本 $x$ 和来自先前生成器的重放输入 $x^{'}$ 的混合数据分布。
图（c）新的求解器接收当前任务的输入 $(x, y)$ 以及重放的 $(x^{'}, y^{'})$ ，重放的 $y^{'}$ 是通过将生成的输入 $x^{'}$ 输入到先前的求解器中获得的。