这篇博客是一个教程,废话不多说,直接开始
1 语料的展示
因为我做的是dna数据所以这里和大家不一样。。。。。。。。。。。。。。。

2 下载官方代码
官方下载地址:GloVe(c语言版本)
3 修改文件
- 首先将源码上传到服务器
-
打开demo.sh
- 将前面的代码注释掉(如下图)

- 对应的将CORPUS修改为自己的语料名字,我的是words.txt (注意带上后缀)
- 到这里就大功告成了,接下来就是训练了。
- 输入 make

-
输入bash demo.sh

- 完事,vectors.txt就是我们要的词向量。
4 结果展示
这里可以看得出来结构和word2vec的还是很相似的,在第一行加上词的个数和维度就一样了。

本教程详细介绍了如何使用GloVe官方C语言版本代码进行词向量训练,包括下载代码、修改配置文件、上传服务器、编译运行等步骤,最终得到可用于自然语言处理任务的词向量。
3069

被折叠的 条评论
为什么被折叠?



