11、词嵌入技术：从基础到动态应用

root9

于 2025-07-20 16:51:26 发布

阅读量43

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习实战指南文章标签：词嵌入动态嵌入 Word2Vec

本文链接：https://blog.youkuaiyun.com/root9/article/details/151034686

深度学习实战指南专栏收录该内容

53 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

词嵌入技术：从基础到动态应用

1. 垃圾邮件分类器中的词嵌入模型

1.1 模型构建与编译

在垃圾邮件分类任务中，我们首先构建并编译模型。模型构建时，需要指定一些关键参数，如词汇表大小、嵌入维度、最大序列长度等。构建完成后，使用分类交叉熵损失函数和 Adam 优化器进行编译：

model.build(input_shape=(None, max_seqlen))
# compile
model.compile(optimizer="adam", loss="categorical_crossentropy", 
metrics=["accuracy"])

1.2 训练与评估

由于数据集存在不平衡问题（4827 条正常邮件和 747 条垃圾邮件），为了缓解这个问题，我们设置了类别权重，将垃圾邮件错误的代价设为正常邮件错误代价的 8 倍。训练模型时，将类别权重作为额外参数传入 model.fit() 函数：

NUM_EPOCHS = 3
CLASS_WEIGHTS = { 0: 1, 1: 8 }
# train model
model.fit(train_dataset, epochs=NUM_EPOCHS,
   validation_data=val_dataset,
   class_weight=CLASS_WEIGHTS)

评估模型时，我们遍历测试数据集，记录真实标签和预测标签，然后计算测试准确率和混

订阅专栏解锁全文

会员秒杀 ¥9.9 重磅福利

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

root9

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

词嵌入技术：如何通过词嵌入技术，实现智能文本分类和命名实体识别？

AI天才研究院

06-27

4320

词嵌入的计算原理主要包括两部分：词向量的计算和上下文向量的计算。

词嵌入技术在社交媒体分析中的应用

AI天才研究院

07-22

1534

作者：禅与计算机程序设计艺术随着互联网的飞速发展，基于网络、移动终端和社会化网络服务构建起来的社交网络正在成为当今世界上最大的生态系统之一。随着互联网技术的不断发展和社会生活的深刻变化，传播动态信息的方式也越来越多样化，不同形式的信息通过不同的渠道和平台得以广泛地传播和扩散。在这个过程中，社交媒体数据的分析对传播者、消费者和企业都具有重

参与评论您还未登录，请先登录后发表或查看评论

NLP 技术的突破与未来：从词嵌入到 Transformer

u014358031的博客

01-04

1838

从早期的词嵌入到如今的 Transformer，NLP 技术经历了从浅层到深层的跃迁。尽管在模型性能、生成能力等方面取得了巨大的进展，但随之而来的资源消耗和社会责任问题也需要更多关注。未来，如何平衡技术创新与可持续发展，如何通过更小的样本获得更好的结果，将成为 NLP 领域的核心研究方向。随着 Transformer 的持续改进和新技术的涌现，NLP 的未来无疑充满了可能性。

NLP关键技术：词嵌入层

逐梦苍穹的博客

08-07

1958

NLP关键技术：词嵌入层

深入解析词嵌入（Word2Vec、GloVe）技术原理：从词语到向量的转变

easyaigx的博客

04-30

1639

在自然语言处理（Natural Language Processing，NLP）领域，如何让计算机理解人类语言的含义一直是一个重要课题。传统的处理方法通常依赖于“词袋模型”（Bag-of-Words，BoW），将文本中的每个词作为独立的单位处理。然而，这种方法存在许多问题，最主要的问题是无法捕捉到词与词之间的上下文关系，也就是说，它忽略了词语的语法和语义信息。词嵌入（Word Embedding）技术的提出，恰好弥补了这一缺陷。

深度解析生成式 AI：从技术原理到实战应用

LNNNNNNNNLLLL的博客

05-26

3550

生成式人工智能（Generative AI）是通过深度学习模型自动创造文本、图像、代码、视频等内容的技术体系，其核心在于从数据中学习概率分布并生成符合人类认知的输出。与传统判别式 AI（如图像分类）不同，生成式 AI 实现了从 "识别" 到 "创造" 的跨越，典型应用包括：。prompts = ["### 问题：{}\n### 回答：{}".format(q, a) for q, a in zip(examples["question"], examples["answer"])]。

文本向量化-词嵌入方法系列2：动态词嵌入（ELMo+BERT+XLNet）

weixin_72032564的博客

11-09

1243

本文主要介绍了分散式文本表示中的三种动态词嵌入方法：ELMo、BERT和XLNet，介绍了每种模型的结构特点以及它们之间的对比。

自然语言处理从入门到应用——动态词向量（Dynamic Word Embedding）：ELMo词向量

冯·诺依曼

06-18

1万+

最自然的做法是使用两个LSTM的最后一层隐含层输出作为词的动态向量表示。然而，在ELMo模型中，不同层次的隐含层向量蕴含了不同层次或粒度的文本信息。例如，越接近顶层的LSTM隐含层表示通常编码了更多的语义信息，而接近底层的隐含层表示（包括输入表示。因此，ELMo采取对不同层次的向量表示进行加权平均的机制，为不同的下游任务提供更多的组合自由度。表示每个向量的权重，反映每一层向量对于目标任务的重要性，可由一组参数根据Softmax函数归一化计算得到，该权重向量可在下游任务的训练过程中学习；

AI：词嵌入技术（Word Embedding）

xyzroundo的专栏

07-18

1393

摘要：词嵌入技术通过将词语映射为低维向量，捕捉语义和语法特征，是自然语言处理（NLP）的核心基础。其发展经历了从早期神经概率模型到Word2Vec、GloVe等静态嵌入，再到BERT等动态上下文感知模型的演进。当前主流技术各具特点，如Word2Vec训练快、FastText解决未登录词问题，而BERT具备强大的上下文理解能力。前沿趋势包括多模态嵌入、领域自适应和模型优化。应用场景广泛，涵盖文本分类、机器翻译、推荐系统等，并催生了OpenAI Embeddings等商业API。未来面临偏见消除、多语言支持等挑

ChatGPT技术原理解析：从RL之PPO算法、RLHF到GPT4、instructGPT

热门推荐

结构之法算法之道

01-15

22万+

本篇ChatGPT笔记会全力做到，通俗易懂且循序渐进(尽最大努力让每一个初学者哪怕是文科生都能没有障碍的读懂每一字一句、每一个概念、每一个公式) 一方面，对于想了解ChatGPT背后原理和如何发展而来的，逐一阐述从GPT/GPT2/GPT3到强化学习、PPO算法，最后再到instructGPT、ChatGPT、SeqGAN 且本文之前，99%的文章都不会把PPO算法从头推到尾，本文会把PPO从零推到尾，按照“RL-策略梯度-重要性采样(重要性权重)-TRPO(增加信任区域和KL散度约束)-PPO”的顺序逐步

【人工智能领域】向量化技术综述：从数学基础到产业应用的全面解析向量化技术在

04-12

文中对比了主流嵌入模型如Word2Vec、GloVe和FastText的特点和适用场景，并探讨了词嵌入技术从One-Hot Encoding到基于Transformer的预训练语言模型（如BERT、GPT）的发展历程。此外，文章还讨论了文本向量化后的语义...

词嵌入技术：将文本转化为计算机可理解的向量

AI天才研究院

02-24

1223

在计算机科学领域，文本数据是一种非常常见的数据类型。然而，文本数据的处理和分析却面临着许多挑战。其中最大的挑战之一就是如何将文本数据转化为计算机可以理解和处理的形式。传统的方法，如词袋模型（Bag of Words）和TF-IDF，虽然在某些场景下取得了一定的成功，但它们无法捕捉到词语之间的语义关系，导致在许多复杂任务中表现不佳。词嵌入技术在过去几年取得了显著的进展，但仍然面临着许多挑战和未来的发展趋势，包括：动态词嵌入：目前的词嵌入技术主要是静态的，即每个词语只有一个向量表示。

STM32+MAX7219数码管模块显示程序 SPI接口

12-02

提供了基于STM32F4xx系列的MAX7219数码管模块显示程序，通过SPI串行总线进行通信，使用库函数进行编程。经过实际测试，该程序能够正常驱动数码管进行显示。特点基于STM32F4xx系列MCU 使用SPI串行总线通信采用库函数编程实测能正常驱动MAX7219数码管模块显示

基于大疆M100无人机平台的自主导航与智能决策系统开发项目_该项目专注于在复杂动态环境中实现无人机的实时障碍物感知与规避以及高效全局与局部路径规划算法的集成与优化核心内容包括利.zip

12-02

Turbo 码编码及解码仿真程序(Matlab)

12-02

Turbo 码编码及解码仿真程序(Matlab)

【改进灰狼算法】基于记忆、进化算子和局部搜索的改进灰狼优化算法及线性种群规模缩减算法（Matlab代码实现）