中文nlp word2vec模型训练生成和导入使用和降维画图

loong_XL

于 2019-03-02 21:05:07 发布

阅读量1.9k

点赞数 2

CC 4.0 BY-SA版权

分类专栏：深度学习文章标签： word2vec 自然语言处理

本文链接：https://blog.youkuaiyun.com/weixin_42357472/article/details/88081398

深度学习专栏收录该内容

339 篇文章 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了中文自然语言处理中word2vec模型的训练过程，包括文本预处理、模型生成，以及如何导入和使用训练好的模型。同时，文章还提及了将模型进行降维操作以进行可视化的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

参考：https://blog.youkuaiyun.com/qq_35273499/article/details/79098689
1、生成模型
a、先进行文本处理，主要就是分词处理

import jieba.analyse
import jieba

jieba.suggest_freq('沙瑞金', True)
jieba.suggest_freq('田国富', True)
jieba.suggest_freq('高育良', True)
jieba.suggest_freq('侯亮平', True)
jieba.suggest_freq('钟小艾', True)
jieba.suggest_freq('陈岩石', True)
jieba.suggest_freq('欧阳菁', True)
jieba.suggest_freq('易学习', True)
jieba.suggest_freq('王大路', True)
jieba.suggest_freq('蔡成功', True)
jieba.suggest_freq('孙连城', True)
jieba.suggest_freq('季昌明', True)
jieba.suggest_freq('丁义珍', True)
jieba.suggest_freq('郑西坡', True)
jieba.suggest_freq('赵东来', True)
jieba.suggest_freq('高小琴', True)
jieba.suggest_freq('赵瑞龙', True)
jieba.suggest_freq('林华华', True)
jieba.suggest_freq('陆亦可', True)
jieba.suggest_freq('刘新建', True)
jieba.sugg