《AliCoCo2: Commonsense Knowledge Extraction, Representation and Application in E-commerce》中文校对版

文章汉化系列目录



摘要

 人类在进行网上购物时所使用的常识知识非常宝贵,但现有运行在电商平台上的系统却很难捕捉到这些知识。尽管构建电商领域的常识知识图谱极具挑战性,但与已经被广泛研究的开放领域知识图谱(例如 Freebase)相比,在这些图谱上进行表示学习(representation learning)更是面临独特的挑战。通过利用常识知识和表示学习技术,电商中的各种应用可以从中受益。基于 AliCoCo [16](一个大规模的电商概念网络,已支持阿里巴巴的一系列核心业务),我们进一步丰富了它的常识关系,并提出了 AliCoCo2,这是第一个为电商使用而构建的常识知识图谱。我们设计了一个多任务编码器-解码器框架,为 AliCoCo2 中的节点和边提供高效的表示。为了探索常识知识对提升电商业务的潜力,我们将新挖掘的常识关系和学习到的嵌入分别应用于电商搜索引擎和推荐系统,并以不同方式验证其效果。实验结果表明,我们提出的表示学习方法在知识图谱补全(KGC)任务上达到了当前最优性能(state-of-the-art),并且在搜索和推荐系统中的应用也展现了常识知识图谱在电商领域的巨大潜在价值。此外,在构建 AliCoCo2 的过程中,我们提出了一个电商问答(QA)任务,并设计了一个新的基准,用于测试机器在电商领域的常识推理能力。这一任务可以帮助研究界进一步探索常识推理技术的发展。

引言

 常识知识反映了我们对世界和人类行为的自然理解,是全人类共同分享的认知。在网上购物时,诸如“天气变冷时需要穿得暖和”“商务风格的T恤通常有尖领”“孕妇需要防滑鞋和防辐射服”等常识会影响我们的购物决策。然而,这些知识是人类通过日常生活经验隐式获得的,因此机器很难捕获和利用这些知识。

 为了向用户提供智能且友好的电商搜索和推荐服务,全球最大的中国电商平台阿里巴巴构建了大规模概念网络 AliCoCo [16]。在 AliCoCo 中,提出了一个四层结构来描述电商中复杂的用户需求,其中包含数百万个定义明确类型系统的原始概念,这些概念构成了电商的基础语言体系。在本文中,我们系统地扩展了 AliCoCo,通过在原始概念层中添加丰富的常识关系,引入了 AliCoCo2,这是第一个为电商用途构建的常识知识图谱。图1展示了 AliCoCo2 的快照,其中电商中的常识知识通过短语概念及其之间的关系进行表示。在图谱中定义了不同类型的常识关系,包括:概念与类别之间的 “isa” 关系,两个类别之间的 “互补” 关系,以及诸如 “style_to_design”“season_to_function”“映射” 关系。特别地,对于某些关系存在额外约束,这使得传统的三元组 ⟨ s , p , o ⟩ \langle s, p, o \rangle s,p,o(主语-谓语-宾语)变为四元组 ⟨ s , p , o , c ⟩ \langle s, p, o, c \rangle s,p,o,c c c c:约束)。以图1中的“商务风格”(图中央加粗边框)为例,四元组: ⟨ business_style , r:style_to_design , pointed_collar , T-shirts ⟩ \langle \text{business\_style}, \text{r:style\_to\_design}, \text{pointed\_collar}, \text{T-shirts} \rangle business_style,r:style_to_design

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值