1 背景
随着这两年AI的兴起,又卷起了一股时代的浪潮,“大模型”这几个字似乎每天都能看到,给人的感觉:每个领域都在使用自己的模型。比如AI写作,AI画图,AI编曲,AI制作视频,与人类竞争的岗位将越来越多,就在前不久,苹果宣布放弃造车,将重点投入AI领域,可见未来AI有一个巨大的发展空间。
因此,本篇博客给大家介绍AI的一个基础研究:Transformer,主要是以普及知识为主。
2 Transformer内容介绍
Transformer是一种强大的神经网络架构,最初由Google的研究人员在论文《Attention is All You Need》中提出,用于自然语言处理任务,特别是在机器翻译方面取得了巨大成功。
Transformer的核心思想是完全基于自注意力机制(self-attention mechanism)来实现序列到序列(sequence-to-sequence)的学习。它在自然语言处理(NLP)和其他序列到序列任务中表现出色