神经网络中依赖于上下文的处理的连续学习

最新推荐文章于 2025-07-08 20:00:00 发布

SrdLaplaceGua

最新推荐文章于 2025-07-08 20:00:00 发布

阅读量3.1k

点赞数 3

CC 4.0 BY-SA版权

分类专栏：机器学习读书笔记文章标签：深度学习神经网络上下文学习连续学习多任务学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/SrdLaplace/article/details/78283343

本文探讨了神经网络在连续学习和上下文依赖处理中的挑战，提出正交权重修改（OWM）方法解决遗忘问题。通过正交投影保持任务间的独立性，并介绍PFC-LIKE模块，模拟人脑根据不同任务改变输出的能力。实验在CASIA-HWDB1.1手写汉字和CelebA面部识别数据集上展示了有效性和应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Continuous Learning of Context-dependent Processing in Neural Networks

作者： Guanxiong Zeng, Yang Chen, Bo Cui and Shan Yu

5 Oct 2018

今天下午陈阳师兄来讲他最近的工作，感觉挺巧妙的，主要是解决两个问题，神经网络会遗忘和连续学习的问题。

Orthogonal Weights Modification (OWM)

一个神经网络先学习一个任务，训练完成后，再进行另外一个任务的训练，往往会将第一个任务遗忘。但人脑并不是这样，这个方法就是要解决这个问题。给两个任务先后学习，给两个任务的输入，希望神经网络的结果都是正确的。
我的理解是这个方法的原理是利用正交空间的思想，使得学习第二个任务时候不影响第一个任务的解：

$y=W⋅xy=W\cdot x$

$y=(W+ΔW)⋅xy=(W+\Delta W)\cdot x$

只要学习时更新权重的方向 $ΔW\Delta W$ 与原来的输入 $x$ 都正交，就不会影响原来的解。由矩阵论的性质可知，正交投影矩阵

$P=I−A(ATA+αI)−1ATP=I-A(A^TA+\alpha I)^{-1}A^T$
$A=[x_1,x_2,...,x_n]$

满足这个性质。即任意一个向量 $b$ ，都可以分解成原来的输入空间 $A$ 上的分量和与 $A$ 正交的分量，先用最小二乘法求解输入空间 $A$ 上的分量有

$b=A⋅kb=A\cdot k$

$AT=ATA⋅kA^T=A^TA\cdot k$

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 8

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。