268G+训练好的word2vec模型(中文词向量)

268G+训练好的word2vec模型(中文词向量)

【下载地址】268G训练好的word2vec模型中文词向量分享 本仓库提供了一个经过268G+语料训练好的word2vec模型,适用于中文词向量的应用。该模型基于百度百科、搜狐新闻和小说等多种语料进行训练,能够有效地捕捉中文词汇之间的语义关系 【下载地址】268G训练好的word2vec模型中文词向量分享 项目地址: https://gitcode.com/Resource-Bundle-Collection/635b7

介绍

本仓库提供了一个经过268G+语料训练好的word2vec模型,适用于中文词向量的应用。该模型基于百度百科、搜狐新闻和小说等多种语料进行训练,能够有效地捕捉中文词汇之间的语义关系。

模型参数

  • window: 5
  • min_count: 10
  • size: 128
  • hs: 1
  • negative: 0
  • iter: 5

使用方法

加载模型

模型提供了两种格式:binmodel

bin格式
from gensim.models import KeyedVectors

model = KeyedVectors.load_word2vec_format('model_path', binary=True)
model格式
from gensim.models import Word2Vec

model = Word2Vec.load('model_path')

训练语料

  • 百度百科:800w+条,26G+
  • 搜狐新闻:400w+条,13G+
  • 小说:229G+

注意事项

  • 模型文件较大,建议在网络条件良好的情况下进行下载。
  • 使用时请确保已安装gensim库。

贡献

欢迎提交问题和建议,帮助改进模型。

许可证

本项目遵循CC 4.0 BY-SA版权协议。

【下载地址】268G训练好的word2vec模型中文词向量分享 本仓库提供了一个经过268G+语料训练好的word2vec模型,适用于中文词向量的应用。该模型基于百度百科、搜狐新闻和小说等多种语料进行训练,能够有效地捕捉中文词汇之间的语义关系 【下载地址】268G训练好的word2vec模型中文词向量分享 项目地址: https://gitcode.com/Resource-Bundle-Collection/635b7

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

姜旭野Flower-Like

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值