自然语言处理中的词向量、循环神经网络及相关技术
1. 词向量类比
词向量嵌入的一个优点是能够将类比关系线性化。我们可以使用预训练的 GloVe 向量来进行一些类比实验。
1.1 加载 GloVe 向量
以下是加载 GloVe 向量的代码:
import numpy as np
import scipy
from sklearn.manifold import TSNE
import matplotlib.pyplot as plt
%matplotlib inline
# 加载 glove 向量
EMBEDDING_FILE = '/media/santanu/9eb9b6dc-b380-486e-b4fd-c424a325b976/glove.6B.300d.txt'
print('Indexing word vectors')
embeddings_index = {}
f = open(EMBEDDING_FILE)
count = 0
for line in f:
if count == 0:
count = 1
continue
values = line.split()
word = values[0]
coefs = np.asarray(values[1:], dtype='float32')
embeddings_index[word] = coefs
f.close()
print('Found %d word vectors of glove.' % len(embeddings_index))
</
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



