基于引文约束估算文本作者生卒年份的研究
在信息检索领域,对引文的研究众多,但针对犹太教文献中引文的研究却独具挑战。本文聚焦于通过引文约束来估算文本作者的出生和死亡年份,以下将详细介绍相关内容。
1. 引文约束相关概念
在进行作者生卒年份估算时,我们使用了一些特定的概念和常量:
- 作者相关 :X 表示待研究的作者,Yi 表示其他作者。
- 年份相关 :B 代表出生年份,D 代表死亡年份。
- 常量相关 :MIN 为犹太教作者开始写作回应时的最小年龄(当前设为 30),MAX 为犹太教作者的最大寿命(当前设为 100),RABBI_DIS 为拉比和其学生的年龄差距(当前设为 20)。这些常量的估计是启发式的,但基于典型回应作者的生活方式是合理的。
引文存在不同类型,包括无提示词的一般引文和带有“拉比”“朋友”“已故”等提示词的引文。同时,引文可分为引用在世作者和引用已故作者两类,犹太教文献中对已故作者的引用远多于在世作者。
我们引入了不同确定性程度的引文约束:
- 铁约束(I) :绝对正确,无任何例外。
- 启发式约束(H) :几乎总是正确,但当 MIN、MAX 和 RABBI_DIS 的启发式估计不正确时可能出现例外。
- 贪婪约束(G) :对于回应作者来说是相当合理的约束,但使用时有时会得出错误估计。