Position Embedding总结和Pytorch实现

ζั͡ޓއއއ坏尐絯

于 2024-10-16 20:40:04 发布

阅读量547

点赞数 1

分类专栏：深度学习文章标签： embedding pytorch 人工智能

本文链接：https://blog.youkuaiyun.com/qq_51976556/article/details/142956847

版权

文章目录

出现背景
PE

出现背景

自注意力机制处理数据，并不是采用类似RNN或者LSTM那种递归的结构，这使得模型虽然能够同时查看输入序列中的所有元素（即并行运算），但是也导致了没办法获取当前word在序列种的位置信息，使模型对顺序信息捕捉很差。

PE

位置编码公式

在这里插入图片描述

思路

采用sin和cos函数对word的每一维上进行唯一编码，这样每个word都得到了自己的位置编码信息，并且由于sin和cos都是连续函数，所以针对pos相近的word，他们的位置编码信息也是比较相近的，这样序列的顺序信息就能够获取到了。

TODO遗留问题：sin和cos都是周期函数，会存在位置编码信息重叠吗？

code

import torch
import torch.nn as nn
import math


class PositionalEncoding(nn.Module):
    def __init__(self, d_model, max_len=5000

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ζั͡ޓއއއ坏尐絯

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

LLM - 位置编码 Position Embedding (Transformer/ViT/Swin/MAE) 源码实现

AGI

12-26

2471

Position Embedding(位置编码)，Transformer的位置编码，2i是偶数维度，2i+1是奇数维度，pos表示序列的位置，i是维度。

pytorch，position embedding 代码实现

_Hope_

02-20

5019

class PositionalEmbedding(nn.Module): def __init__(self, demb): super(PositionalEmbedding, self).__init__() self.demb = demb inv_freq = 1 / (10000 ** (torch.arange(0.0, d...

参与评论您还未登录，请先登录后发表或查看评论

Pytorch 实现position embedding位置编码(三)——DETR中的位置编码(2d的绝对位置编码)(PositionEmbeddingSine正余弦位置编码)

hxxjxw的博客

07-11

4214

Pytorch 实现position embedding位置编码(三)——DETR中的位置编码

（pytorch进阶之路）四种Position Embedding的原理及实现

qq_19841133的博客

08-09

1万+

定义子函数，获得每个window中两两patch之间二维的位置偏差，使用torch.meshgrid函数，根据x轴和y轴范围得到网格每个点的x坐标和y坐标，将其堆叠，获取任何两个点之间的横轴与纵轴坐标的差值，扩维做差即可。假设width等于5，有5个patch，0，1，2，3，4，第一个patch[0]和最后边的patch距离是-4，最后一个patch和最左边的距离是4，综上距离值域是[-4, 4]，个数是2 * 4 + 1，即。这里的table是随机初始化的，在模型中是可学习的。......

Position Embedding 的解释及具体应用

qq_43613342的博客

11-13

2万+

Position Embedding 的解释及具体应用这是我的第一篇博客，想把博客作为分享巩固自己学习感悟的地方。最近做了一个要用到Position Embedding 的项目，于是就研究了一下。词向量词向量，顾名思义就是把每一个单词变成一个向量，以便于后续对文本进行处理，词向量在pytorch中是用nn.Embedding(n_letters + 1, dim)来实现的，这个函数相当定义了一个词向量矩阵，n_letters 是你文本中所有单词的个数，dim是你设置的词向量维数。为什么是max_s

Transformer模型中的Position Embedding实现

胡萝卜不甜的博客

08-21

865

Transformer模型中的Position Embedding实现

Transformer模型中的Position Embedding实现：技术分析与实际案例

qq_24087951的博客

09-02

802

Position Embedding是一种技术，用于向Transformer模型的输入中添加位置信息，以弥补模型本身不处理序列顺序的缺陷。位置编码使得模型能够理解序列中元素的相对位置，从而提高模型的上下文理解能力。在Transformer中，位置编码主要有两种实现方式：基于正弦和余弦函数的固定位置编码（Sinusoidal Position Embedding）和可学习的位置编码（Learnable Position Embedding）。

从零搭建Pytorch模型教程（三）搭建Transformer网络

CV技术指南（微信公众号）

04-15

5050

前言本文介绍了Transformer的基本流程，分块的两种实现方式，Position Emebdding的几种实现方式，Encoder的实现方式，最后分类的两种方式，以及最重要的数据格式的介绍。本文来自公众号CV技术指南的技术总结系列欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。在讲如何搭建之前，先回顾一下Transformer在计算机视觉中的结构是怎样的。这里以最典型的ViT为例。如图所示，对于一张图像，先将其分割成Nx...

旋转式位置编码Rotary Position Embedding（RoPE）

taoqick的专栏

06-04

1842

这篇堪称苏剑林老师的代表作了，简单来说RoPE就是乘上复数形式即可。以下转载自https://kexue.fm/archives/8265。其中Re[]表示实数部分，

Transformer实现以及Pytorch源码解读（二）-embedding源码分析

铁血军的小博客

12-20

3437

Embedding的过程源码解读

Transformer模型：Postion Embedding实现（Transformer 模型中位置编码（Position Embedding）的详细实现与实践）

Dreams°的博客

09-05

532

下面是一个详细的代码示例，展示了如何在 Transformer 模型中实现和应用位置编码。这个示例将使用 PyTorch，包含位置编码的实现、如何将位置编码集成到 Transformer 模型中，以及训练模型位置编码（Position Embedding）在 Transformer 模型中至关重要，因为它为序列中的每个位置添加了位置信息，使模型能够理解序列的顺序关系。不同于传统的循环神经网络（RNN），Transformer 通过位置编码将位置信息融入到每个词向量中，从而处理序列数据。位置编码的的完整代码。

Transformer输入Embedding及位置编码详解

m0_64148253的博客

07-15

3135

我们在本文主要介绍Transformer中的输入Embedding及位置编码。Embedding是一种将离散的输入数据（如单词、字符等）转换为连续的向量表示的方法。由于计算机无法直接处理一个单词或者一个汉字，所以需要Embedding把一个token转化成计算机可以识别的向量。

position_embedding，pytorch的transformers版本

qq_33321762的博客

11-21

807

不传入position_ids的话，自动使用look_up table embedding

position embedding 代码

_Hope_

01-14

3261

第二种实现

pytorch embedding层详解（从原理到实战）

热门推荐

skywf的博客

03-06

5万+

做nlp很多时候要用到嵌入层，pytorch中自带了这个层什么是embedding层这是一个写的比较好的我用最通俗的语言给你讲在nlp里，embedding层就是把单词表[‘你’，‘好’，‘吗’] 编码成 ‘你’ --------------[0.2,0.1] ‘好’ --------------[0.3,0.2] ‘吗’ --------------[0.6,0.5] 的向量的办...

pytorch——embedding层

七月听雪的博客

08-29

8370

深度学习框架主要是整明白，每一层的输入输出。是什么： embed = torch.nn.Embedding(n_vocabulary,embedding_size) embedding层（嵌入层）其实就是一个（n_vocabulary*embedding_size ）矩阵，n_vocabulary代表你有多少个词，embedding_size代表每一个词的词向量的维度。所以这个矩阵就是保...

PyTorch(二)——搭建和自定义网络

hudongloop的博客

05-10

2万+

PyTorch的学习和使用（二）最近刚好在看一篇与Siamese network有关的论文，在PyTorch中没有example，caffe中有，刚好使用PyTorch实现。（PS：图片单独打开更清晰）主要步骤为：数据预处理模型搭建模型训练数据预处理Siamese的网络结构如下：通过输入两张图片X1和X2，经过权重共享的CNN，各自得到一个输出特征向量Gw(X1)G_w(X_1)和Gw(

Pytorch nn.Embedding用法（包括加载预训练模型，加载Word2vec,加载glove）

真的是个瘦子

04-03

4万+

pytorch nn.Embedding class torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None, max_norm=None, norm_type=2, scale_grad_by_freq=False, sparse=False) num_embeddings (int) - 嵌入字典的大小 ...

Rotary Position Embedding (RoPE, 旋转式位置编码) | 原理讲解+torch代码实现

weixin_43646592的博客

05-29

4万+

Rotary Position Embedding (RoPE, 旋转式位置编码) | 原理讲解+torch代码实现

transformers pytorch实现