moses-chart笔记

本文介绍了Moses翻译系统中语法模型的关键配置项,包括span大小限制、短语最大长度及粘合规则等,并解释了这些配置如何影响翻译过程。


1. extract-rules

1.1 Span Size Limit : The limit on span sizes can be set with max-chart-span. In fact its default is 10, which is not a useful setting for syntax models.

from http://www.statmt.org/moses/?n=Moses.SyntaxTutorial


1.2 max-phrase-length 

from http://comments.gmane.org/gmane.comp.nlp.moses.user/4194


1.3 max-phrase-length 在chart抽短语时候指的是初始短语长度

在training中设置max-phrase-length为5。extract rule显示:


而extract-rules后面的参数为:


默认:--MaxSpan[10]  --MinWords[1] | --MaxSymbolsTarget[999] | --MaxSymbolsSource[5] | --MaxNonTerm[2] 


1.4 Glue rules

<s> [X] ||| <s> [S] ||| 1 ||| ||| 0
[X][S] </s> [X] ||| [X][S] </s> [S] ||| 1 ||| 0-0 ||| 0
[X][S] [X][X] [X] ||| [X][S] [X][X] [S] ||| 2.718 ||| 0-0 1-1 ||| 0

这几条规则的含义见:http://comments.gmane.org/gmane.comp.nlp.moses.user/9253


1.5 Rule format

http://www.statmt.org/moses/manual/manual.pdf

关键点:非终结符对应关系不看编号,看alignment。

### 如何在Windows上安装Moses 为了在Windows操作系统上成功安装Moses机器翻译系统,可以遵循一系列特定的操作指南。虽然官方文档可能更侧重于Linux环境下的配置文件名为`moses.ini`的设置[^1],对于Windows用户的指导相对较少,下面提供了一种适用于Windows平台的安装流程。 #### 下载必要的工具和库 首先需要下载并准备好一些基础组件: - 安装Cygwin或MinGW/MSYS来模拟Unix-like shell环境以及编译器链。 - 获取Git用于克隆源码仓库。 - 安装Perl解释器因为部分脚本依赖于此语言执行。 - 配置Boost C++ Libraries版本至少为1.50以上。 - 准备Zlib压缩库支持。 #### 设置工作目录与获取源代码 创建一个新的文件夹作为项目根目录,在此位置打开命令提示符窗口运行如下指令以拉取最新版Moses源码: ```bash git clone https://github.com/moses-smt/mosesdecoder.git moses-cmd cd moses-cmd ``` #### 编译过程 进入上述克隆下来的`moses-cmd`路径下继续操作,利用之前准备好的环境来进行编译: 如果选择了Cygwin,则直接调用configure脚本来初始化Makefile;而采用MinGW的话则需指定额外参数确保兼容性良好: ```bash ./bjam --toolset=gcc link=static threading=multi variant=release stage ``` 请注意这一步骤可能会花费较长时间取决于个人电脑性能状况。 #### 测试安装成果 完成编译之后应该可以在当前路径发现可执行程序`bin\moses.exe`,此时可以通过简单的测试样例验证整个部署是否正常运作。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值