TensorFlow中Embedding和One-Hot的区别及应用

最新推荐文章于 2025-12-05 10:47:22 发布

程序代码工程师

最新推荐文章于 2025-12-05 10:47:22 发布

阅读量200

点赞数

CC 4.0 BY-SA版权

文章标签： tensorflow embedding neo4j 机器学习-深度学习

本文链接：https://blog.youkuaiyun.com/YOLOv3333/article/details/133048152

机器学习-深度学习专栏收录该内容

64 篇文章 ¥59.90 ¥99.00

订阅专栏

本文深入探讨了在TensorFlow中用于离散特征表示的Embedding和One-Hot编码。One-Hot将离散特征转化为二进制向量，适合特征取值少且离散度高的情况；而Embedding则通过学习低维稠密向量表示特征，适用于特征取值多或连续性强的场景。理解两者差异有助于在实践中选择合适的方法提升模型性能。

简介
在深度学习中，特征表示是至关重要的一部分。对于离散型的特征，常常需要将其转化为向量形式，以便于神经网络进行处理。TensorFlow提供了两种常见的转换方式：Embedding和One-Hot编码。本文将深入探讨Embedding和One-Hot的区别，并展示它们在TensorFlow中的使用。

一、One-Hot

概念及原理
One-Hot编码是将离散的特征表示成二进制向量的一种方法。具体来说，它将每个取值转换为一个唯一的索引，然后将该索引编码为一个全零数组，只有对应索引位置为1。例如，对于一个三元特征[apple, orange, banana]，其One-Hot编码可以表示为：
apple -> [1, 0, 0]
orange -> [0, 1, 0]
banana -> [0, 0, 1]
代码实现
在TensorFlow中，可以使用tf.one_hot函数来实现One-Hot编码。下面是一个简单的示例代码：

import tensorflow as tf

# 原始特征
features = [

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

程序代码工程师

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

深入理解TensorFlow中Embedding和One-Hot的区别

DkVhdl的博客

09-25

257

在TensorFlow中，Embedding和One-Hot是两种常用的向量表示方法，用于将离散的符号或类别转换为密集的实值向量。它们在自然语言处理（NLP）等领域中广泛应用。本文将详细介绍Embedding和One-Hot的区别，并提供相应的源代码示例。

NLP - 词的表示：Bow,One-hot, TF-IDF、word2vec

AI工程化、开源分享、文档翻译、代码笔记

01-02

1154

文章目录词的表示潜在语义分析方法（BOW）Countervector 计数TF-IDFBOW 和 TF-IDF 方法的问题词的独热（One-hot ）表示独热问题的改进解决维度过大的问题解决无语义的问题 -- 词的分布式表示Word Embedding 词嵌入使用场景Word embedding的训练方法1、无监督或弱监督的预训练2、端对端（end to end）的有监督训练。参考资料参考转载自： https://www.jianshu.com/p/cede3ae146bb 词的表示潜在语义分析方法

参与评论您还未登录，请先登录后发表或查看评论

PyTorch 稀疏函数解析：embedding 、one_hot详解

CDBmax的博客

01-17

2537

本篇博客探讨了 PyTorch 框架中几个关键的稀疏函数，包括embedding和one_hot。这些函数在处理自然语言处理（NLP）任务和其他需要高效、灵活处理大量类别或序列数据的应用中至关重要。embedding函数用于从预定义的嵌入矩阵中检索指定索引的嵌入向量，支持自定义嵌入矩阵大小、填充索引和范数限制。提供了一种高效的方法来处理变长序列，通过聚合（如求和、均值或最大值）嵌入向量，而无需单独处理每个序列。one_hot。

一文搞懂one-hot和embedding

Alex的博客

03-02

4万+

在 NLP领域，word embedding 已经成为了众所周知的技术。在现实生活中 word embedding 已经拥有非常广泛的应用：语音助手、机器翻译、情感分析… 因为 word embedding 的特殊性，它几乎覆盖了所有 NLP 的应用。接下来说说传统的 one-hot 编码开始，阐述其优劣，并延伸至 word embedding 技术和其优点人类可以很轻易地理解一个单词、词组或者字母，比如「LOVE」，但机器是理解不了的。想要让机器理解单词，就必须要把它变成一串数字（向量）。下面介绍.

tensorflow的one_hot函数（ONE_HOT编码）

qq_36489492的博客

03-21

929

tensorflow的one_hot函数的功能：主要是将类别转换成one_hot类型的张量输出。 tf.one_hot(indices, depth, on_value=None, off_value=None, axis=None, dtype=None, name=None) 如：target = tf.one_hot(target, 10, 1, 0) 参数功能如下： 1）indice...

讲清楚embedding到底在干什么

热门推荐

得道者

10-28

4万+

要搞清楚embeding先要弄明白他和one hot encoding的区别，以及他解决了什么one hot encoding不能解决的问题，带着这两个问题去思考，在看一个简单的计算例子以下引用 YJango的Word Embedding–介绍 https://zhuanlan.zhihu.com/p/27830489 One hot representation 程序中编码单词的一个方法是o...

一步步理解bert

mr2zhang的博客

06-15

3213

文章目录NLPWord Embedding缺点：RNN/LSTM/GRUseq2seq缺点：Contextual Word EmbeddingNeural Network Language Model NLP NLP：自然语言处理（NLP）是信息时代最重要的技术之一。理解复杂的语言也是人工智能的重要组成部分。而自google在2018年10月底公布BERT在11项nlp任务中的卓越表后，BERT（...

TensorFlow中Embedding和One-Hot的区别

优快云精品推荐

12-30

938

自然语言处理从小白到大白系列（2）word Embedding从one-hot到word2vec

ibelieve8013的博客

10-11

1467

我们知道，对于我们的计算机来说，没有办法像人一样理解自然语言，在人工智能领域，这还有很长一段路要走，就算要直接处理自然语言，都很困难。因此，人们想办法把自然语言用数字的方式表示，便于计算和分析，这就是为什么要做词嵌入：word embedding。本文将从以下的方面讲述word embedding：one-hot, word2vec, glove, fast-text.

One-Hot编码

Rhett_Butler0922的博客

04-25

814

One-Hot编码是处理分类变量的基础技术，PyTorch通过F.one_hot和torch.eye提供了高效实现。在深度学习中，One-Hot编码常用于标签处理，但对于高维特征，嵌入层（如）是更好的选择。

2301_78372746的博客

11-24

2354

鱼类识别系统，基于TensorFlow搭建卷积神经网络算法，通过收集了包括‘墨鱼’、‘多宝鱼’、‘带鱼’、‘石斑鱼’等在内的30种鱼类图像数据集进行训练，最后得到一个识别精度较高的模型，然后搭建Web可视化操作平台。前端后端：Django算法：TensorFlow、卷积神经网络算法具体功能系统分为管理员和用户两个角色，登录后根据角色显示其可访问的页面模块。登录系统后可发布、查看、编辑文章，创建文章功能中集成了markdown编辑器，可对文章进行编辑。

TensorFlow 基础训练循环（简化版 + 补全代码）

最新发布

servepeople的博客

12-05

357

模型是，用tf.Module封装权重w和偏置b（方便管理参数、后续保存）。# 初始化参数（w=5.0，b=0.0，原文固定初始化，实际中常用随机初始化）self.w = tf.Variable(5.0) # 权重（要学习的参数）self.b = tf.Variable(0.0) # 偏置（要学习的参数）# 模型的计算逻辑：输入x，输出预测值y_pred = w*x + b# 创建模型实例# 查看模型参数（tf.Module自动收集变量）

【水果识别系统】Python+TensorFlow+Django+人工智能+深度学习+卷积神经网络算法

子午的博客

12-01

636

水果识别系统，基于TensorFlow搭建Resnet50卷积神经网络算法，通过对5种常见的水果图片数据集（‘圣女果’, ‘梨’, ‘芒果’, ‘苹果’, ‘香蕉’）进行训练，最后得到一个识别精度较高的模型，然后搭建Web可视化操作平台。技术栈项目前端使用Html、CSS、BootStrap搭建界面。后端基于Django处理逻辑请求基于Ajax实现前后端数据通信选题背景与意义。

【鸟类识别系统】Python+TensorFlow+Django+人工智能+深度学习+卷积神经网络算法

子午的博客

12-02

554

鸟类识别系统，通过TensorFlow搭建卷积神经网络算法，数据集使用经典的加利福尼亚大学CUB-200-2011鸟类数据集，对其进行多轮迭代训练，最后得到了一个精度较高的模型，并搭建Web可视化操作平台。技术栈项目前端使用Html、CSS、BootStrap搭建界面。后端基于Django处理逻辑请求基于Ajax实现前后端数据通信选题背景与意义在生态保护与生物多样性研究日益重要的当下，精准识别鸟类品种对科研及爱好者而言意义重大。传统鸟类识别依赖人工比对图鉴，不仅效率低且对专业知识要求高。

【植物识别系统】Python+TensorFlow+Django+人工智能+深度学习+卷积神经网络算法

子午的博客

12-04

499

植物识别系统，基于TensorFlow搭建Resnet50卷积神经网络算法，通过对6种常见的植物树叶图片数据集（广玉兰、杜鹃、梧桐、樟叶、芭蕉、银杏）进行训练，最后得到一个识别精度较高的模型，然后搭建Web可视化操作平台。技术栈项目前端使用Html、CSS、BootStrap搭建界面。后端基于Django处理逻辑请求基于Ajax实现前后端数据通信选题背景与意义本项目选题背景聚焦于传统植物识别对专业知识的较高依赖及效率瓶颈问题。

【动物识别系统】Python+TensorFlow+Django+人工智能+深度学习+卷积神经网络算法

子午的博客

12-01

435

动物识别系统，基于TensorFlow搭建Resnet50卷积神经网络算法，通过对4种常见的动物图片数据集（猫、鸡、马、狗）进行训练，最后得到一个识别精度较高的模型，然后搭建Web可视化操作平台。技术栈项目前端使用Html、CSS、BootStrap搭建界面。后端基于Django处理逻辑请求基于Ajax实现前后端数据通信选题背景与意义在人工智能技术蓬勃发展的当下，动物识别作为计算机视觉领域的重要应用方向，有着广泛的实际需求，如动物保护监测、智能安防等场景均需精准高效的动物识别能力。

tensorflow Keras 模型的保存与加载

servepeople的博客

12-04

873

摘要：Keras模型保存与加载方法相比tf.Module更简洁高效。通过model.save()可保存模型计算图、权重及训练配置（需先compile），使用tf.keras.models.load_model()加载时无需原始类定义即可恢复完整模型。Keras自动处理权重恢复，且支持保存优化器状态实现续训功能，但未编译模型加载时会警告需手动compile才能训练。自定义层需通过custom_objects参数指定。Keras整合了底层SavedModel特性与高层训练功能，显著简化了模型保存、共享和部署流程

【花朵识别系统】Python+TensorFlow+Django+人工智能+深度学习+卷积神经网络算法

子午的博客

12-02

585

花朵识别系统，基于TensorFlow搭建Resnet50卷积神经网络算法，通过对5种常见的花朵图片数据集（‘雏菊’, ‘蒲公英’, ‘玫瑰’, ‘向日葵’, ‘郁金香’）进行训练，最后得到一个识别精度较高的模型，然后搭建Web可视化操作平台。技术栈项目前端使用Html、CSS、BootStrap搭建界面。后端基于Django处理逻辑请求基于Ajax实现前后端数据通信选题背景与意义。

TensorFlow 中 “延迟变量创建（Deferred Variable Creation）” 机制

servepeople的博客

12-02

597

核心是讲解 TensorFlow 层的「灵活设计底层机制」——延迟变量创建层的变量（wb）不在初始化时创建，而是推迟到第一次调用时；第一次调用时，从输入x的形状中提取输入特征数（），再创建匹配形状的变量；用is_built标记确保变量只创建一次，后续调用复用变量；最终实现“无需指定输入维度，只指定输出维度”的灵活层设计，这也是高层 API（如 Keras）的核心实现逻辑之一。简单说：这种设计让层“更聪明”，能自动适配输入，不用用户手动计算和指定输入特征数，减少出错概率，同时保持层的通用性。

one-hot-embedding是什么意思？

12-04

2. embedding 和 one-hot 编码在神经网络中的区别是什么？ 3. 为什么 embedding 能捕捉语义信息？最后，确保回答真实可靠，基于引用。 ### One-Hot-Embedding 的含义与定义用户查询“one-hot-embedding”的定义...