本文重在模型代码运行部分~
附上Github链接:xiaohuiyan / BTM
如果在linux环境下,代码包含 运行示例:
$ cd script
$ sh runExample.sh
windows下可分4步:
第1步: 为文档中的单词建立索引
id从0号开始
python script/indexDocs.py <doc_pt> <dwid_pt> <voca_pt>
<doc_pt> 输入要索引的文档,每行是一个文档,格式为 “word word…”
<dwid_pt> 输出文档索引,每行都是一个格式为 “wordId wordId…” 的文档
<voca_pt> 输出词汇文件,每行是一个 “wordId word” 格式的单词

本文介绍了如何在Windows下运行Biterm Topic Model(BTM)。首先,为文档建立索引;其次,使用g++编译生成btm.exe文件进行主题学习;接着,推断文档的主题比例;最后,显示主题结果并解决可能出现的编码问题。运行示例和参数解释可在提供的Github链接和runExample.sh中查看。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



