19、变压器网络与异常检测：原理、实现与应用

flink9streamer

于 2025-11-01 15:41:25 发布

阅读量19

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习异常检测入门文章标签：变压器网络异常检测时间序列

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/flink9streamer/article/details/154338462

深度学习异常检测入门专栏收录该内容

21 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

变压器网络与异常检测：原理、实现与应用

变压器解码器

变压器解码器由 M 个解码器块组成。每个解码器块将编码器的最终输出作为额外输入，与前一个解码器块的输出相结合（如果是第一个解码器块，则与带有位置编码的输出嵌入相结合）。

解码器有一个额外的多头注意力层，用于执行交叉注意力，即关注编码器的最终输出。其中，掩码多头注意力层的功能与编码器中的多头注意力层类似，但会应用因果掩码，确保注意力仅计算先前的标记，而非未来的标记。第二个多头注意力层则没有掩码，其查询来自掩码多头注意力层的输出，而键和值矩阵则使用最终编码器层的输出计算，这样就能结合编码器对原始输入序列的表示来计算注意力分数。

例如，在从英语到法语的语言翻译任务中，编码器接收英语句子并输出编码，这个编码可看作代表初始英语句子的“思维”矩阵。在翻译过程中，模型利用这个“思维”矩阵聚焦于英语句子的相关部分。解码器块的其余部分与编码器块类似。

变压器推理

变压器的推理是以自回归方式进行的，在机器翻译场景中的工作流程如下：
1. 使用编码器对输入句子进行编码。
2. 使用 <sos> 作为解码器的句子起始标记。
3. 利用 <sos> 和编码结果，获取下一个单词的概率分布。可以使用选择技术来挑选单词，如贪心搜索算法选择概率最高的单词，也可以对前 K 个标记进行采样或进行束搜索。
4. 选取下一个单词，将其添加到输出序列中，得到 <sos> 和 <first_output> ，其中

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。