论文解读系列文章目录
文章目录
一、研究表明,人类的认知系统是基于概念的[4, 20],而概念的分类和本体赋予人类理解能力[30]。什么意思?
这句话的意思是:
人类认知依赖于概念:研究表明,人类在理解和处理世界时,通常是通过概念化来进行的。所谓“概念”,是人们对事物、现象或想法的一种抽象化表述。它帮助人们归纳和分类信息,从而更好地理解复杂的现实。
分类和本体的作用:概念并不是孤立存在的,而是通过分类和结构化的方式进行组织。分类系统和本体(Ontology)是对概念及其关系的一种系统化描述。这种结构不仅帮助人们更高效地存储和检索信息,还为理解和推理提供了基础。例如,通过本体可以明确某些概念之间的从属关系(如“苹果”是“水果”的一种)或功能关联(如“雨伞”用来“防雨”)。
因此,这句话强调了分类和本体在构建人类认知能力中的关键作用。它们不仅是组织信息的工具,更是支持人类认知和推理的基础框架。这一理念为文章中构建电子商务认知网(AliCoCo)提供了理论依据,通过对用户需求的概念化和本体化,可以帮助电子商务平台更好地理解和满足用户的复杂需求。
二、举个例子
人类认知基于概念的例子
当你看到一只苹果,你会立即意识到:
- 它是“水果”这一类别中的一员(概念分类)。
- 它的属性可能包括“红色”、“甜的”、“可食用”(概念的特性)。
- 它的功能是“可以吃来补充营养或解渴”(概念的关联意义)。
这一切认知都来源于你头脑中已有的概念体系。如果你从未见过苹果,你可能会通过学习来将其归类到“水果”的大类中。
分类和本体如何支持认知的例子
假设在超市中寻找适合烘焙蛋糕的食材:
- 你知道“面粉”、“鸡蛋”、“黄油”属于“烘焙原料”这一类别。
- 通过超市的分类体系(可能按用途或原料分类),你可以快速找到这些商品的位置。
- 这些分类体系在帮助你理解“蛋糕需要什么材料”以及“哪些材料可以替代”(比如黄油和植物油的功能相似)方面起到了关键作用。
在电子商务中的应用
当用户在电商平台上搜索“孩子保暖”时:
- 平台如果只基于“保暖”关键词,可能无法正确理解用户需求。
- 如果电商平台有一套类似于人类认知的概念体系(如“孩子保暖”被定义为一类电子商务概念),它会推荐围巾、手套、保暖内衣、加热设备等,而不仅仅局限于某个具体商品。
这种基于概念和分类的认知方式,使得系统不仅能匹配商品,还能理解用户真正的需求场景,从而更智能地提供帮助。
三、Wide & Deep [7] 框架
Wide & Deep 是一种结合了 线性模型(Wide 部分) 和 深度神经网络(Deep 部分) 的推荐系统框架,旨在同时捕获记忆性特征和泛化性特征,从而在推荐任务中实现更好的效果。它由以下两部分组成:
-
Wide 部分
Wide 部分是一个广义线性模型,能够有效记忆历史交互特征或显式的特征组合。它擅长捕捉稀疏的、高维的特征和显式的交互特征,例如手工设计的交叉特征。 -
Deep 部分
Deep 部分是一个深度神经网络,用于自动学习特征的隐式表示和复杂的特征交互。通过嵌入层将稀疏特征转化为稠密向量,再通过全连接层捕捉高阶特征交互。
联合训练
Wide & Deep 模型的输出是两部分预测结果的加权求和,损失函数统一优化这两部分的参数:
y
=
σ
(
Wide Output
+
Deep Output
)
y = \sigma(\text{Wide Output} + \text{Deep Output})
y=σ(Wide Output+Deep Output)
应用场景
Wide & Deep 框架广泛用于推荐系统、广告系统等场景。例如,Google 在 Google Play 中使用该框架实现了大规模推荐,兼顾了推荐的精准性和泛化能力。
四、Wide & Deep 框架示例:电子商务推荐
场景
假设你在一个电子商务平台上,想要为用户推荐合适的商品。用户之前购买了一双运动鞋,接下来可能会感兴趣购买与运动相关的商品,比如运动服、运动背包等。
Wide 部分
- Wide 部分利用显式的历史交互特征:
- 用户购买了“运动鞋”。
- 用户浏览过“运动服”相关的商品。
- 用户搜索过“健身用品”。
- Wide 模型通过手工设计的特征组合,比如:
- (商品类型 = 运动鞋)AND(用户年龄 = 20-30)→ 运动服。
- (商品品牌 = Nike)→ 推荐 Nike 的相关商品。
这些规则捕捉到用户行为和商品之间的显式关联,比如用户购买运动鞋后通常会购买运动服。
Deep 部分
- Deep 部分利用用户和商品的隐式特征,通过深度学习模型进行高阶特征学习:
- 用户的隐式特征:嵌入用户的兴趣、年龄、性别等信息。
- 商品的隐式特征:嵌入商品的类型、品牌、价格等信息。
- 深度模型通过神经网络学习复杂的用户行为与商品之间的潜在模式。例如:
- 用户最近对“跑步健身”类的商品点击次数多,Deep 模型可以识别这一趋势并推荐跑步相关的商品,比如运动手表。
联合预测
最终,Wide 部分捕捉显式规则关系,Deep 部分学习隐式高阶特征交互,两者的输出结果相加,再通过 Sigmoid 函数计算推荐得分。比如:
- 推荐运动服的得分为 0.85(高相关性)。
- 推荐健身背包的得分为 0.70(中等相关性)。
总结
Wide 部分记住了明确的历史行为(规则记忆),Deep 部分则挖掘了隐式的复杂关系(泛化能力),两者结合使得推荐既精准又具备拓展性,从而满足用户的多样化需求。
五、词性(POS)标注特征 p i p_i pi 什么意思?
词性(Part-of-Speech, POS)标注是为句子中的每个单词分配一个对应的词性标签(如名词、动词、形容词等)。在序列标注任务中,词性特征 p i p_i pi 表示输入句子中第 i i i 个单词的词性信息,用于为模型提供额外的语法特征。
1. 为什么使用词性特征?
词性特征可以为序列标注任务(如命名实体识别、语义标注等)提供额外的上下文信息,帮助模型更好地理解单词的角色。例如:
- 地名通常是名词(如“Paris”标注为名词)。
- 动作类单词通常是动词(如“live”标注为动词)。
- 介词和连接词可以暗示实体之间的关系(如“in”标注为介词)。
通过引入词性特征,模型可以学习到特定词性标签与目标标签(如命名实体类别)之间的关系。
2. 如何获取词性特征?
-
POS 标注工具
使用现成的 POS 标注工具(如 NLTK、Spacy 或 Stanford NLP)对句子进行词性标注。例如:- 输入句子:
I live in Paris
- POS 标签:
I/PRP live/VBP in/IN Paris/NNP
- PRP: 代词
- VBP: 动词(非第三人称单数)
- IN: 介词
- NNP: 专有名词
- 输入句子:
-
特征表示
POS 特征通常通过嵌入的方式表示:- 为每个 POS 标签分配一个独立的嵌入向量(类似于词嵌入)。
- 例如,PRP -> [0.1, 0.2], VBP -> [0.3, 0.5],形成向量 p i p_i pi。
3. POS 特征的作用
在序列标注任务中,POS 特征可以:
- 提供单词的语法角色信息。
- 增强模型对上下文的理解,特别是在区分模糊单词时。
- 改善特定任务的性能,例如命名实体识别中地名(NNP)的识别。
4. 示例:POS 特征如何帮助命名实体识别
句子:I live in Paris
- 词性标注:
- x 1 = "I" x_1 = \text{"I"} x1="I", p 1 = PRP p_1 = \text{PRP} p1=PRP(代词)。
- x 2 = "live" x_2 = \text{"live"} x2="live", p 2 = VBP p_2 = \text{VBP} p2=VBP(动词)。
- x 3 = "in" x_3 = \text{"in"} x3="in", p 3 = IN p_3 = \text{IN} p3=IN(介词)。
- x 4 = "Paris" x_4 = \text{"Paris"} x4="Paris", p 4 = NNP p_4 = \text{NNP} p4=NNP(专有名词)。
结合词性特征 p i p_i pi,模型可以学习到:
- 代词和动词通常不是命名实体。
- 专有名词(NNP)更可能是地名(如“Paris”)。
5. 最终输入表示
在模型中,词性特征
p
i
p_i
pi 与单词嵌入
x
i
x_i
xi 和其他特征(如字符嵌入
c
i
c_i
ci)拼接形成最终的输入表示:
w
i
=
[
x
i
;
c
i
;
p
i
]
w_i = [x_i; c_i; p_i]
wi=[xi;ci;pi]
其中
p
i
p_i
pi 提供了句法信息,帮助模型更准确地进行序列标注任务。
六、
七、
八、
九、
十、
十一、
十二、
十三、
根据我提供的论文,写出它的1、研究背景 2、论文贡献 3、方法框架 4、研究思路 5、实验 6、限制