随便找了一个训练好的word2vec的bin格式的模型,自己试着对其进行使用一下。在这记录一下。
from gensim.models import word2vec
import gensim
# word2vec模型地址
filepath = "C:\\Users\\MECHREVO\\Desktop\\Python包\\word2vecmodel.bin"
# 加载模拟
model = gensim.models.KeyedVectors.load_word2vec_format(filepath,binary=True)
# 计算两个单词的相识度
print(model.similarity('woman', 'man'))
# 相似的单词
print(model.most_similar('woman'))
# 计算句子的相似度
list1 = ['the', 'cat', 'is', 'walking', 'in', 'the', 'bedroom']
list2 = ['the', 'dog', 'was', 'running', 'across', 'the', 'kitchen']
# print(model.similarity(list1, list2))
print(model.n_similarity(list1, list1))
参考博客:
(24条消息) 词语向量化 — word2vec简介和使用(一)_北木.的博客-优快云博客
(24条消息) Python gensim库使用word2vec 加载和保存模型_from gensim.models import word2vec_小金子的夏天的博客-优快云博客