论文解读系列文章目录
文章目录
一、研究表明,人类的认知系统是基于概念的[4, 20],而概念的分类和本体赋予人类理解能力[30]。什么意思?
这句话的意思是:
人类认知依赖于概念:研究表明,人类在理解和处理世界时,通常是通过概念化来进行的。所谓“概念”,是人们对事物、现象或想法的一种抽象化表述。它帮助人们归纳和分类信息,从而更好地理解复杂的现实。
分类和本体的作用:概念并不是孤立存在的,而是通过分类和结构化的方式进行组织。分类系统和本体(Ontology)是对概念及其关系的一种系统化描述。这种结构不仅帮助人们更高效地存储和检索信息,还为理解和推理提供了基础。例如,通过本体可以明确某些概念之间的从属关系(如“苹果”是“水果”的一种)或功能关联(如“雨伞”用来“防雨”)。
因此,这句话强调了分类和本体在构建人类认知能力中的关键作用。它们不仅是组织信息的工具,更是支持人类认知和推理的基础框架。这一理念为文章中构建电子商务认知网(AliCoCo)提供了理论依据,通过对用户需求的概念化和本体化,可以帮助电子商务平台更好地理解和满足用户的复杂需求。
二、举个例子
人类认知基于概念的例子
当你看到一只苹果,你会立即意识到:
- 它是“水果”这一类别中的一员(概念分类)。
- 它的属性可能包括“红色”、“甜的”、“可食用”(概念的特性)。
- 它的功能是“可以吃来补充营养或解渴”(概念的关联意义)。
这一切认知都来源于你头脑中已有的概念体系。如果你从未见过苹果,你可能会通过学习来将其归类到“水果”的大类中。
分类和本体如何支持认知的例子
假设在超市中寻找适合烘焙蛋糕的食材:
- 你知道“面粉”、“鸡蛋”、“黄油”属于“烘焙原料”这一类别。
- 通过超市的分类体系(可能按用途或原料分类),你可以快速找到这些商品的位置。
- 这些分类体系在帮助你理解“蛋糕需要什么材料”以及“哪些材料可以替代”(比如黄油和植物油的功能相似)方面起到了关键作用。
在电子商务中的应用
当用户在电商平台上搜索“孩子保暖”时:
- 平台如果只基于“保暖”关键词,可能无法正确理解用户需求。
- 如果电商平台有一套类似于人类认知的概念体系(如“孩子保暖”被定义为一类电子商务概念),它会推荐围巾、手套、保暖内衣、加热设备等,而不仅仅局限于某个具体商品。
这种基于概念和分类的认知方式,使得系统不仅能匹配商品,还能理解用户真正的需求场景,从而更智能地提供帮助。
三、Wide & Deep [7] 框架
Wide & Deep 是一种结合了 线性模型(Wide 部分) 和 深度神经网络(Deep 部分) 的推荐系统框架,旨在同时捕获记忆性特征和泛化性特征,从而在推荐任务中实现更好的效果。它由以下两部分组成:
-
Wide 部分
Wide 部分是一个广义线性模型,能够有效记忆历史交互特征或显式的特征组合。它擅长捕捉稀疏的、高维的特征和显式的交互特征,例如手工设计的交叉特征。 -
Deep 部分
Deep 部分是一个深度神经网络,用于自动学习特征的隐式表示和复杂的特征交互。通过嵌入层将稀疏特征转化为稠密向量,再通过全连接层捕捉高阶特征交互。
联合训练
Wide & Deep 模型的输出是两部分预测结果的加权求和,损失函数统一优化这两部分的参数:
y = σ ( Wide Output + Deep Output ) y = \sigma(\text{Wide Output} + \text{Deep Output}) y=σ(Wide Output+Deep Output)
应用场景
Wide & Deep 框架广泛用于推荐系统、广告系统等场景。例如,Google 在 Google Play 中使用该框架实现了大规模推荐,兼顾了推荐的精准性和泛化能力。
四、Wide & Deep 框架示例:电子商务推荐
场景
假设你在一个电子商务平台上,想要为用户推荐合适的商品。用户之前购买了一双运动鞋,接下来可能会感兴趣购买与运动相关的商品,比如运动服、运动背包等。
Wide 部分
- Wide 部分利用显式的历史交互特征:
- 用户购买了“运动鞋”。
- 用户浏览过“运动服”相关的商品。
- 用户搜索过“健身用品”。
- Wide 模型通过手工设计的特征组合,比如:
- (商品类型 = 运动鞋)AND(用户年龄 = 20-30)→ 运动服。
- (商品品牌 = Nike)→ 推荐 Nike 的相关商品。
这些规则捕捉到用户行为和商品之间的显式关联,比如用户购买运动鞋后通常会购买运动服。
Deep 部分
- Deep 部分利用用户和商品的隐式特征,通过深度学习模型进行高阶特征学习:
- 用户的隐式特征:嵌入用户的兴趣、年龄、性别等信息。
- 商品的隐式特征:嵌入商品的类型、品牌、价格等信息。
- 深度模型通过神经网络学习复杂的用户行为与商品之间的潜在模式。例如:
- 用户最近对“跑步健身”类的商品点击次数多,Deep 模型可以识别这一趋势并推荐跑步相关的商品,比如运动手表。
联合预测
最终,Wide 部分捕捉显式规则关系,Deep 部分学习隐式高阶特征交互,两者的输出结果相加,再通过 Sigmoid 函数计算推荐得分。比如:
- 推荐运动服的得分为 0.85(高相关性)。
- 推荐健身背包的得分为 0.70(中等相关性)。
总结
Wide 部分记住了明确的历史行为(规则记忆),Deep 部分则挖掘了隐式的复杂关系(泛化能力),两者结合使得推荐既精准又具备拓展性,从而满足用户的多样化需求。
五、词性(POS)标注特征 p i p_i pi 什么意思?
词性(Part-of-Speech, P