Word2vec初使用

本文展示了如何使用gensim库加载预训练的word2vecbin格式模型,计算单词如woman和man的相似度,以及找到与woman最相似的单词。此外,还提及了计算句子相似度的方法,尽管对于非单个词汇的列表,模型可能无法直接处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

随便找了一个训练好的word2vec的bin格式的模型,自己试着对其进行使用一下。在这记录一下。

 
from gensim.models import word2vec
import gensim

# word2vec模型地址
filepath = "C:\\Users\\MECHREVO\\Desktop\\Python包\\word2vecmodel.bin"
# 加载模拟
model = gensim.models.KeyedVectors.load_word2vec_format(filepath,binary=True)
# 计算两个单词的相识度
print(model.similarity('woman', 'man'))
# 相似的单词
print(model.most_similar('woman'))

# 计算句子的相似度
list1 = ['the', 'cat', 'is', 'walking', 'in', 'the', 'bedroom']
list2 = ['the', 'dog', 'was', 'running', 'across', 'the', 'kitchen']
# print(model.similarity(list1, list2))
print(model.n_similarity(list1, list1))

 参考博客:

(24条消息) 词语向量化 — word2vec简介和使用(一)_北木.的博客-优快云博客

(24条消息) Python gensim库使用word2vec 加载和保存模型_from gensim.models import word2vec_小金子的夏天的博客-优快云博客

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值