最近研究英文NLP,用到些许工具包,在此记录,免得遗忘。也希望前辈同僚们指点推荐。
基本的流程是从surface开始,到浅层语义结束
1. 词义词典
wordnet,提供英文单词的词义、同义反义、词源等,安装配置详见http://blog.youkuaiyun.com/ilovewindseed/article/details/8147613
2. 语义组块分析(Chunk)
CRFChunker,可以将句子拆分成句法组块,以BIO形式标示组块起始
3. 名实体识别(NER)
stanford-ner,识别文章中的名实体
4. 句法分析(SP)
stanford-parser, berkeley-parser:可再训练,开源
5. 语义角色标注(PAS)
swirl,stanford group的人开发的,依赖于名实体识别之后的结果
想使用的同学去google搜索下载安装即可 本人在fc13上可以调通使用。有些工具的使用方法会陆续分享。
284

被折叠的 条评论
为什么被折叠?



