自然语言处理的最新进展
自然语言处理(NLP)是一个动态且快速发展的领域,新趋势、技术和应用不断涌现。本文将介绍近年来该领域的一些有前景的发展。
1. 计算语言学工具和资源的可用性
在计算语言学中,研究的进展依赖于充足的资源,包括相关数据集和易于使用的软件。近年来,研究人员和公司免费提供的资源数量有所增加,像SourceForge和GitHub这样的仓库,以及公开可用的API,为资源的托管和协作提供了平台。
1.1 语言处理的框架、API和工具包
许多自然语言处理研究聚焦于直接服务终端用户的应用,这要求研究人员投入大量时间和精力进行计算方面的开发。现有的框架、API和工具包能简化工具的研发,例如,17岁的Summly创始人将其摘要系统以3000万美元卖给雅虎,该系统依赖SRI国际开发的语言技术。
一些框架是通用的且经过多年发展,如GATE、LingPipe和Stanford CoreNLP;另一些则是为特定应用开发的,如用于问答的QALL - ME框架、用于文本蕴含的BIUTEE和用于共指消解的RECONCILE。
- GATE :一个开源的文本处理解决方案,始于20世纪90年代中期。它支持模块化构建语言处理工具,可通过图形界面或API使用。GATE包含大量可定制的处理组件,最初用于信息提取,现在还涵盖云计算和语义搜索等解决方案。
- NLTK :用Python编写的模块集合,主要用于教学。它实现了计算语言学的常见任务,随着其成功,社区贡献了许多对其他语言编写的NLP工具的包装器,使其不仅用于教学,还用于NLP工
超级会员免费看
订阅专栏 解锁全文
467

被折叠的 条评论
为什么被折叠?



