语言模型N-Gram之KenLM环境的搭建
1 在windows下
在windows下搭建的kenlm只能运用训练好的模型,不能训练模型。
查资料了解到,若想在windows训练kenlm模型,理论上可以在cygwin(仿真linux操作系统)进行。
但是,我折腾了好久好久好久,还是存在一系列的问题,比如需要安装Microsoft Visual C++ 14.0 ,安装完一个又一个。固执的金牛座被打败了,转战linux
cygwin
cygwin是一个windows软件,该软件就是在windows上仿真linux操作系统。简言之,cygwin是一个在windows平台上运行的 linux模拟环境,使用一个Dll(动态链接库)来实现,这样,我们可以开发出Cygwin下的UNIX工具,使用这个DLL运行在Windows下,可以想一下,在运行Windows的同时,也可以使用VI,BASH,TAR,SED等UNIX下的工具例如:要在wins下执行.sh 文件,可以通过该工具。但是这种涉及到很多第三方库的编程,建议不用windows。
2 在linux下(虚拟机Ubuntu搭建)
(1)进入kenlm的github网址https://github.com/kpu/kenlm
对kenlm库进行下载,使用命令:
wget -O - http://kheafield.com/code/kenlm.tar.gz |tar xz

按照官方文档提示,建立kenlm
mkdir -p

最低0.47元/天 解锁文章
1166





