18、神经网络语言学习：从词嵌入到句子向量

最新推荐文章于 2025-11-29 20:13:30 发布

会议雕塑

最新推荐文章于 2025-11-29 20:13:30 发布

阅读量13

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习入门精要文章标签：神经网络词嵌入句子向量

本文链接：https://blog.youkuaiyun.com/pandas7gardener/article/details/154670773

深度学习入门精要专栏收录该内容

26 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

神经网络语言学习：从词嵌入到句子向量

1. 词嵌入与损失函数的影响

在自然语言处理中，神经网络通过词嵌入来对语言进行建模。词嵌入是将单词表示为向量的方式，它能够捕捉单词之间的语义关系。而损失函数的选择对词嵌入所捕获的属性有着重要影响。

1.1 不同的词嵌入聚类方式

使用新的神经网络时，词嵌入的聚类方式会有所不同。之前单词是根据预测正或负标签的可能性进行聚类，现在则是基于在同一短语中出现的可能性进行聚类（有时不考虑情感）。例如：

print(similar('terrible'))
[('terrible', -0.0),
 ('dull', -0.760788602671491),
 ('lacks', -0.76706470275372),
 ('boring', -0.7682894961694),
 ('disappointing', -0.768657),
 ('annoying', -0.78786389931),
 ('poor', -0.825784172378292),
 ('horrible', -0.83154121717),
 ('laughable', -0.8340279599),
 ('badly', -0.84165373783678)]

以及

print(similar('terrible'))
[('terrible', -0.0),
 ('horrible', -2.79600898781),
 ('brilliant', -3.3336178881),

订阅专栏解锁全文

会员秒杀 ¥9.9 重磅福利

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

会议雕塑

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

深度学习实战项目：使用词嵌入对文本相似性进行检测（含源码、数据集、说明文档）.zip

12-18

词嵌入是一种现代自然语言处理技术，它将词语转化为连续的向量表示，使得语义相近的词语在向量空间中的距离也相近。这种方法为理解和比较文本提供了一种定量的方式。项目的核心在于神经网络模型，特别是使用预训练...

参与评论您还未登录，请先登录后发表或查看评论

自然语言处理从入门到应用——静态词向量：全局向量词嵌入GloVe（Global Vectors for Word Representation）

冯·诺依曼

06-16

1万+

无论是基于神经网络语言模型还是Word2vec的词向量预训练方法，本质上都是利用文本中词与词在局部上下文中的共现信息作为自监督学习信号。除此之外，另一类常用于估计词向量的方法是基于矩阵分解的方法，例如潜在语义分析（参考《》）等。这类方法首先对语料进行统计分析，并获得含有全局统计信息的“词–上下文”共现矩阵，然后利用奇异值分解（Singular Value Decomposition，SVD）对该矩阵进行降维，进而得到词的低维表示。

图神经网络入门与实战：从图嵌入(GE)到图神经网络(GNN)

简简单单的学习笔记，致力于帮助更多前进路上的朋友~

04-28

6397

图神经网络超全入门综述，从图->图嵌入->图神经网络->代码实战，参考文献都干货满满！

自然语言处理从入门到应用——预训练模型总览：词嵌入的两大范式

冯·诺依曼

07-02

1万+

从大量无标注数据中进行预训练使许多自然语言处理任务获得显著的性能提升。预训练模型的发展经历从浅层的词嵌入到深层编码两个阶段，按照这两个主要的发展阶段，可以归纳出预训练模型编码的两大范式：静态词向量（Static Word Embedding）和动态词向量（Dynamic Word Embedding）。

自然语言处理从零到入门 词嵌入

UK - UofL HW - SDE

11-07

1396

词向量（Word embedding），又叫Word嵌入式自然语言处理（NLP）中的一组语言建模和特征学习技术的统称，其中来自词汇表的单词或短语被映射到实数的向量。从概念上讲，它涉及从每个单词一维的空间到具有更低维度的连续向量空间的数学嵌入。生成这种映射的方法包括神经网络，单词共生矩阵的降维，概率模型，可解释的知识库方法，和术语的显式表示单词出现的背景。当用作底层输入表示时，单词和短语嵌入已经被证明可以提高NLP任务的性能，例如语法分析和情感分析。

基于神经网络语言模型的词向量生成（NNLM）详解

tt丫的博客

03-05

4193

深度学习入门小菜鸟，希望像做笔记记录自己学的东西，也希望能帮助到同样入门的人，更希望大佬们帮忙纠错啦~侵权立删。目录一、NNLM的网络结构分析二、NNLM的代码实现一、NNLM的网络结构分析 神经网络语言模型NNLM是概率语言模型，它通过神经网络来计算概率语言模型中每个参数。模型如图所示模型输入：，即输入的是的前n-1个词模型输出：根据这已知的 n- 1 个词预测下一个词其中上图：语料库的词向量表示：矩阵C ——大小为 |V| * m ，V表示语料中的总词..

词向量基础：从独热编码到分布式表示的演进

数据知道的博客

08-09

5826

词向量是NLP中将离散词语转化为连续向量的核心技术。本文系统梳理了词向量的演进过程：从古典的独热编码（存在维度灾难和语义鸿沟问题），到基于分布式假说的现代词向量模型（如Word2Vec、GloVe）。重点分析了Word2Vec的Skip-gram和CBOW两种架构，通过预测上下文词来学习低维稠密向量。分布式表示能有效捕捉语义关系，支持向量运算（如"国王-男人+女人≈女王"），解决了传统方法的根本缺陷。演进过程体现了从简单离散表示到复杂连续语义编码的技术飞跃。

【赠书】从深度学习到图神经网络：模型与实践

天地玄黄魑魅魍魉风花雪月商角徵羽

03-18

2915

近年来，深度学习在人工智能的发展过程中起到了举足轻重的作用，而图神经网络是人工智能领域的一个新兴方向，被称为图上的深度学习。本书详细介绍了从深度学习到图神经网络的基础概念和前沿技术，包括**图上的深度学习、图神经网络的数学基础、神经网络学习与算法优化、深度学习基础、神经网络中的表示学习、面向图数据的嵌入表示、初代图神经网络、空域及谱域图卷积神经网络等内容。为增强可读性，本书叙述清晰、内容深入浅出、图文并茂，力求降低初学者的学习难度。

自然语言处理从入门到应用——动态词向量（Dynamic Word Embedding）：ELMo词向量

热门推荐

冯·诺依曼

06-18

1万+

最自然的做法是使用两个LSTM的最后一层隐含层输出作为词的动态向量表示。然而，在ELMo模型中，不同层次的隐含层向量蕴含了不同层次或粒度的文本信息。例如，越接近顶层的LSTM隐含层表示通常编码了更多的语义信息，而接近底层的隐含层表示（包括输入表示。因此，ELMo采取对不同层次的向量表示进行加权平均的机制，为不同的下游任务提供更多的组合自由度。表示每个向量的权重，反映每一层向量对于目标任务的重要性，可由一组参数根据Softmax函数归一化计算得到，该权重向量可在下游任务的训练过程中学习；

深度学习：词嵌入之word2vec

皮皮blog

07-26

1万+

http://blog.youkuaiyun.com/pipisorry/article/details/76147604 word2vec简介深度学习在自然语言处理中第一个应用：训练词嵌入。Google 的 Tomas Mikolov 在《Efficient Estimation of Word Representation in Vector Space》和《Distributed ...

NLP----神经网络语言模型（NNLM），词向量生成，词嵌入，python实现

沃·夏澈德的博客

12-03

4441

理论主要来自论文A Neural Probabilistic Language Model，可以百度到的这篇博文对理论方面的介绍挺不错的链接地址一下是其中的一些截图，主要是算法步骤部分算法步骤前向计算反向更新个人实现的代码 import glob import random import math import pickle import nu...

基于CNN的垃圾邮件分类系统Python实现：从词向量到全连接层 (2025年)

07-30

首先，通过初始化随机词向量将文本数据转换成词嵌入矩阵，然后依次经过一维卷积层(Conv1d)提取局部特征，最大池化层(Max Pooling)压缩特征维度，全连接层整合全局信息，加入Dropout层防止过拟合并采用ReLU激活函数...

【自然语言处理】基于神经网络的文本分类实现：从预处理到模型训练的全流程解析

11-08

在神经网络领域，文本分类实现了从传统算法到深度学习模型的演进，特别是在词嵌入技术的应用后，模型性能得到了显著提升。文本预处理是神经网络文本分类流程的第一步，涉及到分词、去除停用词等操作，将原始文本...

深度学习的自然语言处理：从词嵌入到机器翻译

AI天才研究院

12-31

1424

自然语言处理（NLP，Natural Language Processing）是人工智能（AI）领域中的一个重要分支，其主要目标是让计算机理解、生成和处理人类语言。自然语言处理涉及到语音识别、语义分析、情感分析、机器翻译等多个方面。随着深度学习技术的发展，自然语言处理领域也得到了巨大的推动。本文将从词嵌入到机器翻译的角度，深入探讨深度学习在自然语言处理中的应用和实现。

基于Transformer的量子神经网络：理论、进展与展望

andeyeluguo的博客

11-29

例如，在自回归采样中，我们可以依次确定每个自旋的状态（上或下），前一个自旋的状态会影响后一个自旋的概率分布。这与Transformer处理文本序列（每个词受上下文影响）或图像块序列（每个块受全局图像内容影响）的方式高度相似。因此，将Transformer作为QNNs的拟设，能够利用其强大的序列建模能力来更精确地捕捉量子态中的复杂关联[8]。

深度学习——神经网络

2303_80634169的博客

11-24

4050

本文梳理了深度学习中的核心网络模型及其组件。基础模型包括MLP（全连接层堆叠）、CNN（卷积结构处理图像）、RNN（循环结构处理序列）和Transformer（自注意力机制）。扩展模型涵盖跨模态融合（如CLIP）、图神经网络（如GCN）和强化学习网络（如DQN）。核心组件涉及网络层（卷积/全连接/注意力等）、激活函数（ReLU/Sigmoid等）、优化器（Adam/SGD等）、损失函数（交叉熵/MSE等）以及数据处理方法。通过系统分类和典型示例，为深度学习模型选择与设计提供参考框架。

下一代神经网络：架构革新、能效优化与智能融合的理论综述

andeyeluguo的博客

11-29

此外，无监督学习方面，基于脉冲时序依赖可塑性（STDP）的局部学习规则被用于构建多层SNN，如Meng等人提出的Spiking Inception模块[6]，有效提升了特征提取能力。例如，清华大学团队基于忆阻器阵列构建的SNN芯片[24]，在CIFAR-10上实现>10 TOPS/W的能效比。脉冲神经网络（Spiking Neural Networks, SNNs）作为第三代神经网络模型，通过模拟生物神经元的离散脉冲发放机制，实现了事件驱动的稀疏计算，理论上可比传统ANNs降低数个数量级的能耗[2]。

量子神经网络：理论基础、挑战与发展趋势综述

andeyeluguo的博客

11-29

量子神经网络（Quantum Neural Networks, QNNs）作为量子计算与人工智能交叉领域的前沿方向，近年来受到广泛关注。其旨在利用量子力学原理增强传统神经网络的表达能力与计算效率，在模式识别、优化求解及生成建模等任务中展现出潜在优势。本文系统综述了量子神经网络的理论基础、典型架构、训练机制及其面临的核心挑战，重点分析了“贫瘠高原”（Barren Plateaus）问题的成因与缓解策略，并探讨了其在含噪声中等规模量子（NISQ）设备上的实现路径与应用前景。

多模态量子神经网络：融合、架构与前沿进展