A Neural Probabilistic Language Model笔记

本文详细介绍了神经概率语言模型(NPLM)的基本原理及其结构。包括输入映射层如何通过Cmatrix将词转换为向量表示,隐含层计算词出现的概率,以及输出层采用softmax函数进行归一化。此外还探讨了模型训练过程中参数的迭代更新。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是个人笔记,lz才疏学浅,有什么理解不到位的地方欢迎各种拍 .

  • 理解简述:

    其本身是语言模型,为了验证或者说是预测一句话最可能的表达,在预测的过程中产生word embedding 矩阵,在输入层中将词映射为一个m列的向量,也即词的向量表示,NPLM模型结构一共分为3层,输入 映射-隐含-输出

  • 模型结构图

这里写图片描述

  • 模型训练过程

    • 图中最低的是输入 映射层
      输入是当前词w_t的前n个词 (w_t-n+1~w_t-1) 经过C matrix 映射后到了映射层,模型训练的开始C matrix可以随机初始化,在论文的原文是这样的they could be initialized using prior knowledgeof semantic features. 最终模型train后C matrix也更新。
      • 词向量concat成矩阵
        这里写图片描述
  • 隐含层
    由映射层到隐含层函数,y_t表示词w_t出现的概率
    这里写图片描述

  • 输出层
    由隐含层到输出层归一化指数函数softmax,
    这里写图片描述

参数:这里写图片描述
参数迭代:这里写图片描述
似然求参数
这里写图片描述

备注:公式中字母代表的意义请参考原论文

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值