机器学习--自注意力机制1 引入

本文介绍了如何处理网络输入为序列且长度可变的情况,包括独热编码和词嵌入等向量表示方法,以及针对不同类型输出(如词性标注、情感分析和序列到序列任务)的应用实例。讨论了音频和图数据的处理方式,并以语音识别和翻译为例,阐述了序列到序列任务的特点。

一、输入为序列的情况

截至目前,我们讨论的都是网络的输入为一个向量的情况,
如果是回归问题,输出是一个标量,
如果是分类问题,输出是一个类别。
在这里插入图片描述

当输入是一组向量,并且输入的向量的数量是会改变的,即每次模型输入的序列长度都不一样,这个时候应该要怎么处理呢?
在这里插入图片描述
下面我们举例说明:

1.文字处理

假设网络的输入是一个句子,把句子里面的每一个词汇都描述成一个向量,用向量来表示,模型的输入就是一个向量序列,而且该向量序列的大小每次都不一样(句子的长度不一样,向量序列的大小就不一样)。

(1)独热编码

将词汇表示成向量最简单的做法是独热编码(之前多次提到的,只有对应维度为1,其余维度都是0),创建一个很长的向量,该向量的长度跟世界上存在的词汇的数量是一样多的,每一个维度对应到一个词汇。
在这里插入图片描述

但是这种表示方法有一个非常严重的问题,它假设所有的词汇彼此之间都是没有关系的。cat 和 dog 都是动物,它们应该比较像;cat 是动物,apple 是植物,它们应该比较不像。但从独热向量中不能看到这件事情,其里面没有任何语义的信息

(2).词嵌入(word embedding)也可将词汇表示

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值