gensim使用

最新推荐文章于 2025-06-09 11:10:09 发布

原创最新推荐文章于 2025-06-09 11:10:09 发布 · 236 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#gensim

数据挖掘专栏收录该内容

5 篇文章

订阅专栏

该篇博客介绍了如何使用gensim库训练Word2Vec模型，并演示了如何保存和加载训练好的词向量。通过`Word2Vec`类创建模型，用常见文本数据训练，然后将得到的词向量模型保存到临时文件中。之后，利用`KeyedVectors`类加载保存的模型，以便后续使用。

1. gensim 读取tencent ai

参考文档：gensim models.keyedvectors – Store and query word vectors

>>> from gensim.test.utils import common_texts
>>> from gensim.models import Word2Vec
>>>
>>> model = Word2Vec(common_texts, size=100, window=5, min_count=1, workers=4)
>>> word_vectors = model.wv

>>> from gensim.test.utils import get_tmpfile
>>> from gensim.models import KeyedVectors
>>>
>>> fname = get_tmpfile("vectors.kv")
>>> word_vectors.save(fname)
>>> word_vectors = KeyedVectors.load(fname, mmap='r')

未完待续。。。