Transformer

Transformer是一种突破性的模型,它能同时处理多个任务,关注句子上下文并学习表达语言。其核心是Self-Attention机制,本质上是特征提取器,将平凡的特征转化为有特点的信息。在NLP和CV领域,Transformer简化结构并达到传统方法的效果,成为新一代的backbone。

通俗地理解Transformer

处理词语的方式:传统的方法可能是逐个词地处理,就像阅读一本书,一次只看一个词。但是Transformer不同,它可以同时看很多次,就像是一眼能看到整个句子。

关注重要的地方:Transformer特别擅长关注句子中不同的部分,就像我们读文章时,可能会注意标题、关键词、或者句子中的重要信息。这使得它能理解上下文。

学会表达:它可以学会怎么更好得表达一种语言,就像是一个能自动学语言的机器。这样,我们就可以用它来翻译、写文章,甚至是回答问题。

多任务处理:Transformer可以同时处理很多不同的任务,就像是一个多才多艺的人。这让它在各种语言处理任务上都表现得很好,比如翻译、问答等等。

记得顺序:虽然它能够一次性看到整个句子,但为了理解语言的顺序,它学会了一些特殊的技巧,就好像是在读书时能够感受到故事情节的发展。

        总的来说,Transformer就是一种能够理解和生成语言的强大工具,它的出现让计算机在处理语言时变得更加聪明和灵活。你就可以想象它是一个懂得语言学的机器人,能够在各种语言任务上发挥自己的才华。

Transformer中Self-Attention

tranformer原论文的标题是Attetion is All You Need。

Transformer本质在解决什么事情?

tranformer其实就是一个特征提取器。输入数据经过transfomer,提好特征输出出来就完事了。

计算机本身喜欢有特色的有波澜起伏的特征。Transfomer把平平无奇的特征转移成一些有特点信息,再交给计算机去识别和数据分析。

NLP转移到CV

把图像数据转换成序列,就可以直接往transformer里套用。

出道即巅峰

简单的结构就能达到传统CNN当中很多层的结果

backbone

新一代的backbone,传统的都用的transfomer。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值