PyTorch搭建N-gram模型实现单词预测

最新推荐文章于 2025-10-23 09:20:58 发布

原创

最新推荐文章于 2025-10-23 09:20:58 发布 · 3.2k 阅读

·

7

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#pytorch #n-gram #单词预测 #词嵌入

N-gram模型就是假设预测这个单词只与前面的N-1个单词有关，并不是和前面所有的词都有关系。

所以，对于1-gram（每个词都是独立分布的）:

P(w1, w2, w3, … , wn) = P(w1)P(w2|w1)P(w3|w1w2)P(w4|w1w2w3)…P(wn|w1w2…wn-1)

≈ P(w1)P(w2)P(w3)P(w4)…P(wn)

2-gram（每个词都与左边最近的那个词有关）:

P(w1, w2, w3, … , wn) = P(w1)P(w2|w1)P(w3|w1w2)P(w4|w1w2w3)…P(wn|w1w2…wn-1)

≈P(w1)P(w2|w1)P(w3|w2)P(w4|w3)…P(wn|wn-1)

3-gram（每个词都与左边最近的那两个词有关）:

P(w1, w2, w3, … , wn) = P(w1)P(w2|w1)P(w3|w1w2)P(w4|w1w2w3)…P(wn|w1w2…wn-1)

≈ P(w1)P(w2|w1)P(w3|w1w2)P(w4|w2w3)…P(wn|wn-2wn-1)

而：P(w2|w1)=语料库中w1和w2出现的次数/语料库中w1出现的次数

对于这个条件概率，传统的方法是统计语料中每个词出现的频率，根据贝叶斯定理来估计这个条件概率，这里我们就可以用词嵌入对其进行代替，然后最大化条件概率从而优化词向量，据此进行预测。

下面对代码进行说明：

首先添加引用，net里面是定义的n-gram模型，

import torch
from torch import nn, optim
import net

class n_gram(nn.Module):

最低0.47元/天解锁文章

评论 14

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。