1、让我们使用DBpedia来收集关于演员 - 电影关系的实例对和文本信息。使用以下SPARQL查询,通过DBpedia的SPARQL端点自动收集20组(演员姓名,电影名称,摘要)。PREFIX dbo: http://dbpedia.org/ontology/ PREFIX rdfs: http://www.w3.org/rdf - schema/ select?actorname?filmname?abstract where {?film dbo:starring?actor.?actor rdfs:label?actorname.?film rdfs:label?filmname.?film dbo:abstract?abstract.} 使用一个稍有不同的查询,将演员替换为导演(谓词dbo:director),以获取20个否定句。然后,选取20个句子(10个肯定句,10个否定句)作为开发语料库,将另外20个句子留作后续测试语料库使用。1. 手动开发你自己的词汇模式,并不断优化,直到在开发语料库上获得良好的性能。确定你认为的良好性能是什么,并说明你的决定。2. 使用相同的开发语料库,自动开发不同的模式集。这些模式的范围将从非常具体到更一般。以下是你可以自动构建的不同模式集。• 集合1:“原样”的词汇模式(不做更改 - 完整句子)。• 集合2:电影和演员之间文本片段的词汇模式。• 集合3:与集合2相同,但在电影和演员的左右各添加两个单词。• 集合4:与集合2相同,但在左右添加文本片段直到触发词。通过计算开发语料库中的词频自动找到触发词,并假设前五个实词是触发词。• 集合5:包含随机单字通配符的词汇模式。• 集合6:与集合5相同,但仅在集合2中的两个模式相差一个单词的地方包含通配符。例如,如果集合2中同时包含“A stars in the funny movie F”和“A stars in the great movie F”,则泛化为“A stars in the * movie F”。3. 使用精确率/召回率指标在开发语料库上比较不同的模式集。你的手动模式集与自动生成的模式集相比如何?4. 与问题3相同,但现在是在测试集上。5. 将集合1到6调整为词汇 - 句法模式并进行测试。结果与词汇模式相比如何?
任务步骤
- 手动开发词汇模式并优化,确定良好性能的标准并说明理由。
- 自动开发不同的模式集,涵盖从具体到一般的范围。
- 在开发语料库上使用精确率/召回率指标比较手动和自动生成的模式集。
- 在测试集上重复步骤3的比较。
- 将模式集调整为词汇 - 句法模式并测试,比较结果与词汇模式的差异。
2、a. 按照某种迭代算法,对“may_treat”关系进行半自动关系抽取实验。以下是实验指南:1. 从三对种子对开始,分别是西咪替丁/胃灼热、可乐定/高血压和氯氮平/精神分裂症。2. 将世界卫生组织的基本药物清单作为语料库,收集分配到维基百科类别https://en.wikipedia.org/wiki/Category:World_Health_Organization_essential_medicines的维基百科页面。可以使用之前编写的用于构建特定领域语料库的代码。3. 为了从句子中自动生成模式,使用之前探索的各种方法创建各种模式集。4. 为了过滤模式和实例,需要人工标注员参与。b. 讨论这个过程、获得的结果以及作为人工标注员的体验。你认为在半自动过程中你对于防止语义漂移是否是必不可少的?
a. 实验步骤:
- 以三对种子对(西咪替丁/胃灼热、可乐定/高血压、氯氮平/精神分裂症)启动实验。
- 以世界卫生组织基本药物清单为语料库,收集对应维基百科页面,使用之前编写的构建特定领域语料库的代码。
- 用之前探索的方法从句子自动生成模式。
- 人工标注员过滤模式和实例。
b. 需讨论实验过程、结果和人工标注员体验,思考人工标注员对防止语义漂移是否必要。
3、设置一个实验来测试斯坦福CoreNLP的命名实体识别模块。理想情况下,寻找另一个命名实体识别系统以进行比较研究。比较研究需要以下步骤:1. 收集三个不同的语料库作为数据集。2. 通过提前对一组类型(人物、日期、时长、组织、地点)进行手动标注,生成待查找的命名实体的黄金标准。3. 使用不同的模块执行命名实体识别。4. 使用精确率、召回率和F1值进行评估。5. 分析和讨论结果。例如,在评估中如何处理单词边界?某些类型的实体是否比其他类型更容易出错,为什么?
可按以下步骤开展比较研究:
- 收集数据集:收集三个不同的语料库作为数据。
- 生成黄金标准:提前手动标注人物、日期、时长、组织、地点这些类型的命名实体。
- 执行命名实体识别:使用斯坦福CoreNLP的NER模块和另一个NER系统分别进行识别。
- 评估:使用精确率、召回率和F1值评估两个系统的表现。
- 分析讨论结果:探讨评估中单词边界的处理方式,分析哪种类型的实体更易出错及其原因。

最低0.47元/天 解锁文章
2350

被折叠的 条评论
为什么被折叠?



