[b]Maxent[/b]
使用张乐博士的软件包时,要注意:
1. 空格和table都是分隔符,同时出现在语料中,会造成错误,但信息会打印出来。
2. 在8G内存的情况下,可容纳最大量,大约为1200万*5。
3. 注意最大熵不能识别,同一个event中,相同的feature,要加以区分。
[b]CRF++[/b]
在使用CRF++时要注意:
1. segment fault错误,可能是由于连续两个空行做成的。
2. 在小数量的特征很多时,-f参数对于提高训练速度,有很大的作用。
3. -p 后面最好接奇数,否则,跑不起来。
都是最近遇到的问题,随便写写。
使用张乐博士的软件包时,要注意:
1. 空格和table都是分隔符,同时出现在语料中,会造成错误,但信息会打印出来。
2. 在8G内存的情况下,可容纳最大量,大约为1200万*5。
3. 注意最大熵不能识别,同一个event中,相同的feature,要加以区分。
[b]CRF++[/b]
在使用CRF++时要注意:
1. segment fault错误,可能是由于连续两个空行做成的。
2. 在小数量的特征很多时,-f参数对于提高训练速度,有很大的作用。
3. -p 后面最好接奇数,否则,跑不起来。
都是最近遇到的问题,随便写写。
本文分享了使用Maxent和CRF++过程中的注意事项,包括如何避免空格和表格造成的错误,最大熵模型对相同特征的识别限制,以及CRF++中segmentfault错误的解决办法等。
1010

被折叠的 条评论
为什么被折叠?



