自然语言处理中的情景记忆
1. 数据处理
1.1 PP 附着数据
在自然语言中,介词短语(由介词和名词短语组成的短语)用作其他单词的修饰语,它们限制(指定)那些其他单词(通常是名词或动词)的含义。例如:
He ate a pizza with anchovies
介词短语 “with anchovies” 修饰名词 “pizza” 而不是动词 “ate”,它描述了关于 “pizza” 的信息,而不是关于 “吃” 这个动作的信息。
Ratnaparkhi(1994)提出了一个著名的 PP 附着基准数据集。该数据的典型条目以五列 CSV 文件的形式呈现,如下所示:
eats,pizza,with,anchovies,N
简化后的介词短语 “with anchovies” 修饰名词(N)“pizza”。注意该数据的严格格式:每个条目总是由一个动词、一个名词、一个介词和一个名词,再加上一个 N(名词)或 V(动词)标签组成。
以下是其他示例:
dumped,sacks,into,bin V
介词短语 “into bin” 修饰动词(V)“dumped”。
gives,authority,to,adminis
超级会员免费看
订阅专栏 解锁全文
896

被折叠的 条评论
为什么被折叠?



