法律文本中的命名实体识别与解析
1. 引言
在各类人类语言,尤其是法律文本中,名称(专有名词)扮演着核心角色。它们用于识别法律程序中涉及的各方、律师、法院、司法管辖区、法规、法官等。能够识别文本中的名称序列,并将这些名称解析为其所指的实际对象,对于许多法律文本处理任务至关重要。
例如,在以下法律文本示例中:
SUPREME COURT OF THE UNITED STATES
Syllabus
MICROSOFT CORP. v. AT&T CORP.
CERTIORARI TO THE UNITED STATES COURT OF APPEALS FOR
THE FEDERAL CIRCUIT
No. 051056. Argued February 21, 2007—Decided April 30, 2007
...
其中的名称用于指代公司(如 Microsoft 和 AT&T)、产品(Windows)、地点(United States)、法院(Supreme Court of the United States)以及法规(The Patent Act)等。人类能够识别这些名称并消除其指代的歧义,而对于机器来说,识别和解析这些名称是明确法律文本语义并进行进一步处理的初始步骤。
2. 命名实体识别
我们采用三种方法进行命名实体识别:查找法、上下文规则法和统计模型法,这些方法也可在混合系统中结合使用。
2.1 查找法
查找法是创建一个感兴趣实体的名称列表,然后将文档中出现的
超级会员免费看
订阅专栏 解锁全文
1774

被折叠的 条评论
为什么被折叠?



