- 博客(2)
- 收藏
- 关注
原创 【ACT-Transformer学习笔记1】--注意力机制(Attention)
注意力机制的核心思想是:在处理输入数据时,每个输出并不是直接依赖于整个输入,而是依赖于输入的一个加权部分,即只关注(赋予更多权重)与当前任务最相关的输入部分。通过这种方式,模型可以高效地捕捉到不同位置的关联性。例如,在机器翻译中,翻译一个句子中的某个词时,翻译模型不需要完全依赖于所有输入词,而是通过计算与目标词最相关的输入词(如通过加权计算不同词的相似度)来做出最合适的翻译。这个加权过程就是注意力机制的核心。多头注意力。
2025-04-15 16:03:03
257
原创 ACT(Action Chunking with Transformers)中 Transformers 结构理解
模块功能说明Encoder感知环境与当前状态融合视觉图像、多角度视野、机器人关节状态与风格变量 zDecoder生成未来动作序列通过位置编码结合环境信息,预测接下来的 k 个动作(每个为14维关节位置)Attention机制建立输入输出间的关联支持跨模态信息融合和关键特征提取,保证动作连贯性。
2025-04-01 15:42:26
793
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人