wiki百科上中文语料的Word2vec实验 Python2.7 Windows环境下
准备阶段:1.Python2.72.gensim模块下载,在dos窗口下执行pip install gensim开始阶段:1.从维基百科下载语料,大概1.45G左右https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2 将**.xml.bz2文件转换为txt文档代码如下# -*- coding: ...
原创
2018-03-29 22:20:19 ·
429 阅读 ·
0 评论