论文解读《AliCoCo: Alibaba E-commerce Cognitive Concept Net》

最新推荐文章于 2025-12-03 20:31:34 发布

原创

最新推荐文章于 2025-12-03 20:31:34 发布 · 990 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #计算机视觉

论文解读系列文章目录

文章目录

论文解读系列文章目录
一、研究表明，人类的认知系统是基于概念的[4, 20]，而概念的分类和本体赋予人类理解能力[30]。什么意思？
二、举个例子
三、Wide & Deep [7] 框架
四、Wide & Deep 框架示例：电子商务推荐
五、词性（POS）标注特征 $p_i$ 什么意思？
六、
七、
八、
九、
十、
十一、
十二、
十三、

一、研究表明，人类的认知系统是基于概念的[4, 20]，而概念的分类和本体赋予人类理解能力[30]。什么意思？

这句话的意思是：

人类认知依赖于概念：研究表明，人类在理解和处理世界时，通常是通过概念化来进行的。所谓“概念”，是人们对事物、现象或想法的一种抽象化表述。它帮助人们归纳和分类信息，从而更好地理解复杂的现实。

分类和本体的作用：概念并不是孤立存在的，而是通过分类和结构化的方式进行组织。分类系统和本体（Ontology）是对概念及其关系的一种系统化描述。这种结构不仅帮助人们更高效地存储和检索信息，还为理解和推理提供了基础。例如，通过本体可以明确某些概念之间的从属关系（如“苹果”是“水果”的一种）或功能关联（如“雨伞”用来“防雨”）。

因此，这句话强调了分类和本体在构建人类认知能力中的关键作用。它们不仅是组织信息的工具，更是支持人类认知和推理的基础框架。这一理念为文章中构建电子商务认知网（AliCoCo）提供了理论依据，通过对用户需求的概念化和本体化，可以帮助电子商务平台更好地理解和满足用户的复杂需求。

二、举个例子

人类认知基于概念的例子
当你看到一只苹果，你会立即意识到：

它是“水果”这一类别中的一员（概念分类）。
它的属性可能包括“红色”、“甜的”、“可食用”（概念的特性）。
它的功能是“可以吃来补充营养或解渴”（概念的关联意义）。

这一切认知都来源于你头脑中已有的概念体系。如果你从未见过苹果，你可能会通过学习来将其归类到“水果”的大类中。

分类和本体如何支持认知的例子
假设在超市中寻找适合烘焙蛋糕的食材：

你知道“面粉”、“鸡蛋”、“黄油”属于“烘焙原料”这一类别。
通过超市的分类体系（可能按用途或原料分类），你可以快速找到这些商品的位置。
这些分类体系在帮助你理解“蛋糕需要什么材料”以及“哪些材料可以替代”（比如黄油和植物油的功能相似）方面起到了关键作用。

在电子商务中的应用
当用户在电商平台上搜索“孩子保暖”时：

平台如果只基于“保暖”关键词，可能无法正确理解用户需求。
如果电商平台有一套类似于人类认知的概念体系（如“孩子保暖”被定义为一类电子商务概念），它会推荐围巾、手套、保暖内衣、加热设备等，而不仅仅局限于某个具体商品。

这种基于概念和分类的认知方式，使得系统不仅能匹配商品，还能理解用户真正的需求场景，从而更智能地提供帮助。

三、Wide & Deep [7] 框架

Wide & Deep 是一种结合了 线性模型（Wide 部分） 和 深度神经网络（Deep 部分） 的推荐系统框架，旨在同时捕获记忆性特征和泛化性特征，从而在推荐任务中实现更好的效果。它由以下两部分组成：

Wide 部分
Wide 部分是一个广义线性模型，能够有效记忆历史交互特征或显式的特征组合。它擅长捕捉稀疏的、高维的特征和显式的交互特征，例如手工设计的交叉特征。
Deep 部分
Deep 部分是一个深度神经网络，用于自动学习特征的隐式表示和复杂的特征交互。通过嵌入层将稀疏特征转化为稠密向量，再通过全连接层捕捉高阶特征交互。

联合训练
Wide & Deep 模型的输出是两部分预测结果的加权求和，损失函数统一优化这两部分的参数：
$\sigma(\text{Wide Output} + \text{Deep Output})$

应用场景
Wide & Deep 框架广泛用于推荐系统、广告系统等场景。例如，Google 在 Google Play 中使用该框架实现了大规模推荐，兼顾了推荐的精准性和泛化能力。

四、Wide & Deep 框架示例：电子商务推荐

场景
假设你在一个电子商务平台上，想要为用户推荐合适的商品。用户之前购买了一双运动鞋，接下来可能会感兴趣购买与运动相关的商品，比如运动服、运动背包等。

Wide 部分

Wide 部分利用显式的历史交互特征：
- 用户购买了“运动鞋”。
- 用户浏览过“运动服”相关的商品。
- 用户搜索过“健身用品”。
Wide 模型通过手工设计的特征组合，比如：
- （商品类型 = 运动鞋）AND（用户年龄 = 20-30）→ 运动服。
- （商品品牌 = Nike）→ 推荐 Nike 的相关商品。

这些规则捕捉到用户行为和商品之间的显式关联，比如用户购买运动鞋后通常会购买运动服。

Deep 部分

Deep 部分利用用户和商品的隐式特征，通过深度学习模型进行高阶特征学习：
- 用户的隐式特征：嵌入用户的兴趣、年龄、性别等信息。
- 商品的隐式特征：嵌入商品的类型、品牌、价格等信息。
深度模型通过神经网络学习复杂的用户行为与商品之间的潜在模式。例如：
- 用户最近对“跑步健身”类的商品点击次数多，Deep 模型可以识别这一趋势并推荐跑步相关的商品，比如运动手表。

联合预测
最终，Wide 部分捕捉显式规则关系，Deep 部分学习隐式高阶特征交互，两者的输出结果相加，再通过 Sigmoid 函数计算推荐得分。比如：