关于torch.nn.Embedding的浅显理解

最近在使用词嵌入向量表示我的数据标签,并且在试图理解torch.nn.Embedding函数。

函数提供一个简单的查找表,输入主要为词字典的大小和词嵌入的维度两个参数,输出为对应的词嵌入向量。

torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None, max_norm=None, norm_type=2.0, scale_grad_by_freq=False, sparse=False, _weight=None, _freeze=False, device=None, dtype=None)

词字典的大小num_embeddings限制了索引大小只能从0~ num_embeddings-1。num_embeddings(int) – size of the dictionary of embeddings,就是你给nn.Embedding函数的张量里的索引个数要在0~num_embeddings-1之间;embedding_dim (int) – the size of each embedding vector也即生成的词嵌入向量的最后一个维度。For example:

import torch.nn as nn
import torch

embedding = nn.Embedding(10, 3)

input = torch.LongTensor([[1, 2, 4, 5], [4, 3, 2, 9]])

这里输入的向量input里包含的索引:1,2,3,4,5,9 均在[0,10)之间。embdding的第二个参数就决定了input的每一个数会被扩展到3维。所以最后生成的词嵌入维度如下,其中出现了两个2和两个4,因此索引出来了两个相同的词嵌入向量[-0.6431, 0.0748, 0.6969]和[ 1.4970, 1.3448, -0.9685]。

embedding(input)
        tensor([[[-0.0251, -1.6902,  0.7172],
                 [-0.6431,  0.0748,  0.6969],
                 [ 1.4970,  1.3448, -0.9685],
                 [-0.3677, -2.7265, -0.1685]],

                [[ 1.4970,  1.3448, -0.9685],
                 [ 0.4362, -0.4004,  0.9400],
                 [-0.6431,  0.0748,  0.6969],
                 [ 0.9124, -2.3616,  1.1151]]])
### PyTorch `torch.nn.Embedding` 功能与用法 #### 嵌入层的主要功能 `torch.nn.Embedding` 是一种用于查找表(lookup table)的层类,主要用于将离散的数据(如单词、字符或分类变量)转换为其对应的低维稠密向量表示。这种技术广泛应用于自然语言处理领域中的词嵌入表示以及任何涉及离散特征的任务中[^3]。 该层的核心作用是从输入的一组索引值出发,返回这些索引所对应于预定义大小矩阵中的行向量作为输出。通过这种方式,可以有效地减少高维度稀疏数据的空间复杂度,并提升模型的学习效率。 #### 参数说明 以下是 `torch.nn.Embedding` 的主要参数及其含义: - **num_embeddings**: 表示嵌入矩阵的总行数,即字典或类别总数。 - **embedding_dim**: 每个嵌入向量的维度,也就是每一行的长度。 - **padding_idx (可选)**: 如果指定,则此位置上的嵌入不会被更新,在训练过程中保持不变。 - **max_norm (可选)**: 若设置,每次向前传播时都会重新缩放超过 max_norm 范围的嵌入向量。 - **norm_type (默认为 2.)**: 当设置了 max_norm 后,用来计算范数的方法,默认采用 L2 范数。 - **scale_grad_by_freq (布尔型, 可选)**: 对于稀疏梯度下降优化器而言,如果启用则按频率调整权重更新步幅。 - **sparse (布尔型, 默认 False)**: 是否使用稀疏梯度来节省内存消耗;仅当 optimizer 支持 sparse gradients 才能生效。 #### 使用方法 创建一个 Embedding 层实例之后,可以通过传递整数张量给这个对象来进行前向运算操作。传入的是形状为 `(N,)`, `(N,d0,...dn)` 或者其他形式的 LongTensor 类型数据结构,其中 N 表示批量样本数量。而输出则是相同批次尺寸但最后一轴扩展至 embedding_dim 维的新张量。 #### 示例代码 以下是一个简单的例子展示如何构建和应用 `torch.nn.Embedding`: ```python import torch import torch.nn as nn # 定义超参 vocab_size = 10 # 字典大小/类别数目 embed_size = 3 # 嵌入空间维度 # 初始化Embeddingembedding_layer = nn.Embedding(num_embeddings=vocab_size, embedding_dim=embed_size) # 创建一些假定的输入数据(假设batch size为2) input_tensor = torch.LongTensor([[1,2,4,5],[4,3,2,9]]) output_embedding = embedding_layer(input_tensor) print(output_embedding.shape) # 输出应为 [2, 4, 3], 即 batch * seq_len * embed_dim ``` 上述脚本展示了怎样初始化一个具有特定词汇规模和嵌入维度的 Embedding 层,并演示了其基本调用方式。注意这里生成了一个随机初始状态下的嵌入矩阵,实际项目里可能需要加载预先训练好的 GloVe 或 Word2Vec 来代替随机初始化部分。 --- 相关问题
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

starleeisamyth

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值