组合分布式语义学:具体构建与应用
1. 结构化向量空间中的语义构建
1.1 句子空间与动词向量构建
在语义分析中,我们将句子空间 (S) 定义为 (N \otimes N),其基的形式为 (\overrightarrow{st} = (\overrightarrow{n_i}, \overrightarrow{n_j}))。对于及物动词,句子的含义由动词以及其主语和宾语的含义共同决定。动词向量 (C_{verb}^{itj} (\overrightarrow{n_i}, \overrightarrow{n_j})) 通过统计具有属性 (n_i) 的词作为动词主语,以及具有属性 (n_j) 的词作为动词宾语的出现次数来构建,并且这些计数会根据主语和宾语体现每个属性的程度进行调整。
例如,“dog chases cat” 的含义可以通过以下方式理解:狗具有 “蓬松” 属性且猫具有 “被购买” 属性的程度,以及 “蓬松的事物追逐被购买的事物” 的程度;狗具有 “奔跑” 属性且猫具有 “可爱” 属性的程度,以及 “奔跑的事物追逐可爱的事物” 的程度,以此类推,考虑所有名词属性对。
对于不及物动词的句子,句子空间为 (N)。为了将及物句子和不及物句子的含义进行比较,我们将不及物句子的含义从 (N) 嵌入到 (N \otimes N) 中,将 (\overrightarrow{\epsilon_n})(不及物动词的 “宾语”)视为 (N) 所有基向量的叠加。对于双及物动词的句子,句子空间为 (N \otimes N \otimes N),及物和不及物句子也以同样的方式嵌入到这个更大的空间中。
1.2 形容词的处理
形容词的处
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



