17、深度学习中的词嵌入与序列分析

最新推荐文章于 2025-12-02 09:09:15 发布

time3

最新推荐文章于 2025-12-02 09:09:15 发布

阅读量17

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习的直觉之旅文章标签：深度学习词嵌入 Skip-Gram

本文链接：https://blog.youkuaiyun.com/time3/article/details/151593802

深度学习的直觉之旅专栏收录该内容

32 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

深度学习中的词嵌入与序列分析

1. 词嵌入模型Skip - Gram的实现

在深度学习中，词嵌入是一项关键技术，Skip - Gram模型是一种常用的生成词嵌入的方法。

1.1 模型参数设置

为了构建Skip - Gram模型的数据集，我们使用 input_word_data.py 中修改后的PyTorch Word2Vec数据读取器。训练时的重要参数设置如下：
- 小批量大小：32个样本
- 训练轮数：5个epoch
- 嵌入向量大小：128
- 上下文窗口：目标词左右各5个词
- 从上下文窗口中采样的上下文词数量：4个
- 用于负采样的非上下文词数量：64个

1.2 嵌入层实现

实现嵌入层并不复杂，只需用一个矩阵初始化查找表：

import torch.nn as nn

vocab_size = 500
emb_vector_len = 128
embedding = nn.Embedding(num_embeddings = vocab_size,
                         embedding_dim = emb_vector_len)