《Word2Vec中的数学》- 神经概率语言模型中的数学运算笔记

本文深入探讨了神经概率语言模型(NNML),即word2vec的前身,详细讲解了其网络结构、运算原理及数学公式,包括各层级的运算过程与参数量计算,适合对自然语言处理与深度学习感兴趣的读者。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

神经概率语言模型(或称NNML 神经网络语言模型)中的数学原理

神经概率语言模型是word2vec中算法框架的前身,通过我看到的资料,神经概率语言模型和有的资料中的NNML (神经网络语言模型)应该是指的一个东西。看了《Word2Vec中的数学》中3.3节-神经概率语言模型本人将其中的运算公式写了下来。本文将注重神经概率语言模型网络结构中各层级的运算,包括运算原理、公式以及各矩阵的维度,个人认为,如果能把整个过程中的公式写出来了,那么神经概率语言模型中的数学原理也就掌握了。

神经概率语言模型网络结构以及各层级之间的运算关系见下图:

神经概率语言模型运算过程

其中,输入层有n-1个输入结点,投影层有(n-1)m个神经元,隐藏层有h个神经元,输出层有D个输出结点

参数量为(n-1)mxh+hxD+p+q。

假设one-hot层到输入层的过程称为过程①,输入层到投影层的过程称为过程②,假设词向量维度m=300,前3个词去预测第4个词,则更详细的解释如下:

神经概率语言模型解释

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值