10、TensorFlow教程--- 词嵌入

TensorFlow实践：深入理解词嵌入

Knowledgebase

于 2023-09-30 14:04:23 发布

阅读量943

点赞数

CC 4.0 BY-SA版权

分类专栏：如何学习TensorFlow：从入门到实战文章标签：人工智能深度学习 tensorflow 神经网络机器学习

本文链接：https://blog.youkuaiyun.com/Knowledgebase/article/details/133432944

如何学习TensorFlow：从入门到实战专栏收录该内容

32 篇文章 ¥29.90 ¥99.00

订阅专栏

词嵌入是机器学习中将单词映射到向量的关键技术。本文聚焦TensorFlow实现，介绍如何利用Word2vec进行无监督学习，通过预测单词上下文提升模型效果。TensorFlow提供多种优化的模型实现，支持多线程和高级抽象。

词嵌入是将诸如单词之类的离散对象映射到向量和实数的概念。这对于机器学习的输入非常重要。该概念包括标准函数，可以有效地将离散输入对象转换为有用的向量。

词嵌入输入的示例如下所示 -

blue: (0.01359, 0.00075997, 0.24608, ..., -0.2524, 1.0048, 0.06259)
blues: (0.01396, 0.11887, -0.48963, ..., 0.033483, -0.10007, 0.1158)
orange: (-0.24776, -0.12359, 0.20986, ..., 0.079717, 0.23865, -0.014213)
oranges: (-0.35609, 0.21854, 0.080944, ..., -0.35413, 0.38511, -0.070976)

Word2vec
Word2vec是最常用的无监督词嵌入技术方法。它通过使用跳跃图来训练模型，以使给定的输入词通过预测单词的上下文来预测。

TensorFlow提供了许多实现这种类型模型的方法，具有不断增加的复杂性和优化，使用多线程概念和更高级别的抽象。

import os 
import math 
import numpy as np 
import tensorflow as tf 

from tensorflow.contrib.tensorboard.plugins import projector 
batch_size = 64 
embedding_dimension = 5 
negative_samples = 8 
LOG_DIR = "

了解本专栏