gensim word2vec 词向量文件读写中的问题解决
用的是gensim库。先保存词向量到文件:
w2v.wv.save_word2vec_format(cm.embedding_dir + '/w2v.bin', binary=False)
读取文件时报错:
ValueError: invalid vector on line 0 (is this really the text format?)
打开文件,看到第一行是这样的:
而第二行是这样的:
每一行都是一个汉字开头,然后是300个浮点数(词向量size设为300)
猜想第一行的
原创
2020-09-18 21:25:15 ·
1637 阅读 ·
2 评论