ACE 2005 文件格式

如果还没有获取到ACE语料的人,不建议看本篇文章,因为没有语料的对应,有些东西会比较难看懂,虽然我已经尽量用比较友好的方式来写本文。

由于做关系抽取要用到ACE 2005的语料,所以在此记录一下相关的信息,包括各个文件的内容和格式等,也方便初入门者可以更快地了解这个语料。以下内容主要翻译自CMU的William Cohen小组(我也没有了解过这个小组)和ACE 2007 Spanish DevTest - Pilot Evaluation的文档(一开始没有好好看LDC的网站,所以根据关键词Google到了这个,不过好像这个好像还挺有用的,这里也给以下ACE 2005 Multilingual Training Corpus的网址,上边也有它的Online Documentation)。最后附上一个语料预处理的github项目ACE 2005 Corpus Preprocessing

ACE 2005数据集标注了基本任务:the recognition of entities, values, temporal expressions, relation and events。如果想了解更详细的关于ACE05评测的内容,可以看这里

评论 39
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值