TransformerFAM: Feedback attention is working memory

本文是LLM系列文章,针对《TransformerFAM: Feedback attention is working memory》的翻译。

TransformerFAM:反馈注意力是工作记忆

摘要

虽然Transformer彻底改变了深度学习,但它们的二次注意力复杂性阻碍了它们处理无限长输入的能力。我们提出了反馈注意力记忆(FAM),这是一种新型的Transformer架构,它利用反馈回路使网络能够处理自己的潜在表示。这种设计促进了Transformer中工作记忆的出现,使其能够处理无限长的序列。TransformerFAM不需要额外的权重,可以与预训练的模型无缝集成。我们的实验表明,TransformerFAM显著提高了Transformer在各种模型大小(1B、8B和24B)的长上下文任务上的性能。这些结果展示了增强大型语言模型(LLM)处理无限长度序列的潜力。

1 引言

2 TransformerFAM

3 实验

4 相关工作

5 结论

在电影《记忆碎片》(2000)中,主角与顺行性失忆症作斗争,这意味着他无法记住过去10分钟内发生的任何事情,但他的长期记忆是完整的,他必须在身体上纹身重要信息来记住它。这类似于大语言模型(LLMs)的现状。LLM能够记住整个互联网,这要归功于缩放定律,该定律允许它们以大权重(长期记忆)存储大量信息。然而,他们的短期记忆受到注意力窗口的限制。因此,复杂的提示工程对于帮助他们回忆重要细节变得必要。我们提出了一种名为TransformerFAM的新架构,可以修复LLM的顺行性遗忘症。
机器学习的快速发展令人惊讶,但有两个关键问题我们

由于没有具体的引用内容,下面从通用的 ROS(机器人操作系统)知识角度来介绍 `NavigateToPose::Feedback`。 在 ROS 中,`NavigateToPose` 通常是一个动作(Action),而 `NavigateToPose::Feedback` 是该动作的反馈消息类型。动作机制允许节点之间进行长时间运行的任务通信,在任务执行过程中,动作服务器可以定期向动作客户端发送反馈信息。 `NavigateToPose::Feedback` 类定义了在导航到指定姿态(pose)任务执行过程中,服务器向客户端发送的反馈数据结构。一般来说,它可能包含以下几类信息: #### 1. 导航进度信息 可能会有一个字段表示当前导航任务已经完成的比例,例如 `progress`,取值范围从 0 到 1,0 表示任务刚开始,1 表示任务已完成。 ```python # 示例代码,假设 Feedback 类有一个 progress 属性 feedback = NavigateToPose::Feedback() feedback.progress = 0.3 # 表示任务完成了 30% ``` #### 2. 当前位置信息 包含机器人当前的位置和姿态,例如 `current_pose`,这可以帮助客户端实时了解机器人在导航过程中的位置。 ```python # 示例代码,假设 Feedback 类有一个 current_pose 属性 import geometry_msgs.msg feedback = NavigateToPose::Feedback() current_pose = geometry_msgs.msg.PoseStamped() # 设置当前姿态 # ... feedback.current_pose = current_pose ``` #### 3. 路径相关信息 可能会有字段表示当前规划的路径,或者已经走过的路径,例如 `current_path` 或 `completed_path`。 ```python # 示例代码,假设 Feedback 类有一个 current_path 属性 import nav_msgs.msg feedback = NavigateToPose::Feedback() current_path = nav_msgs.msg.Path() # 设置当前路径 # ... feedback.current_path = current_path ``` #### 4. 距离目标的信息 例如剩余距离 `remaining_distance`,表示机器人距离目标姿态还有多远。 ```python # 示例代码,假设 Feedback 类有一个 remaining_distance 属性 feedback = NavigateToPose::Feedback() feedback.remaining_distance = 2.5 # 表示距离目标还有 2.5 米 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值