论文解读《AliCoCo: Alibaba E-commerce Cognitive Concept Net》

论文解读系列文章目录



一、研究表明,人类的认知系统是基于概念的[4, 20],而概念的分类和本体赋予人类理解能力[30]。什么意思?

这句话的意思是:

人类认知依赖于概念:研究表明,人类在理解和处理世界时,通常是通过概念化来进行的。所谓“概念”,是人们对事物、现象或想法的一种抽象化表述。它帮助人们归纳和分类信息,从而更好地理解复杂的现实。

分类和本体的作用:概念并不是孤立存在的,而是通过分类和结构化的方式进行组织。分类系统和本体(Ontology)是对概念及其关系的一种系统化描述。这种结构不仅帮助人们更高效地存储和检索信息,还为理解和推理提供了基础。例如,通过本体可以明确某些概念之间的从属关系(如“苹果”是“水果”的一种)或功能关联(如“雨伞”用来“防雨”)。

因此,这句话强调了分类和本体在构建人类认知能力中的关键作用。它们不仅是组织信息的工具,更是支持人类认知和推理的基础框架。这一理念为文章中构建电子商务认知网(AliCoCo)提供了理论依据,通过对用户需求的概念化和本体化,可以帮助电子商务平台更好地理解和满足用户的复杂需求。

二、举个例子

人类认知基于概念的例子
当你看到一只苹果,你会立即意识到:

  • 它是“水果”这一类别中的一员(概念分类)。
  • 它的属性可能包括“红色”、“甜的”、“可食用”(概念的特性)。
  • 它的功能是“可以吃来补充营养或解渴”(概念的关联意义)。

这一切认知都来源于你头脑中已有的概念体系。如果你从未见过苹果,你可能会通过学习来将其归类到“水果”的大类中。

分类和本体如何支持认知的例子
假设在超市中寻找适合烘焙蛋糕的食材:

  • 你知道“面粉”、“鸡蛋”、“黄油”属于“烘焙原料”这一类别。
  • 通过超市的分类体系(可能按用途或原料分类),你可以快速找到这些商品的位置。
  • 这些分类体系在帮助你理解“蛋糕需要什么材料”以及“哪些材料可以替代”(比如黄油和植物油的功能相似)方面起到了关键作用。

在电子商务中的应用
当用户在电商平台上搜索“孩子保暖”时:

  • 平台如果只基于“保暖”关键词,可能无法正确理解用户需求。
  • 如果电商平台有一套类似于人类认知的概念体系(如“孩子保暖”被定义为一类电子商务概念),它会推荐围巾、手套、保暖内衣、加热设备等,而不仅仅局限于某个具体商品。

这种基于概念和分类的认知方式,使得系统不仅能匹配商品,还能理解用户真正的需求场景,从而更智能地提供帮助。

三、Wide & Deep [7] 框架

Wide & Deep 是一种结合了 线性模型(Wide 部分)深度神经网络(Deep 部分) 的推荐系统框架,旨在同时捕获记忆性特征泛化性特征,从而在推荐任务中实现更好的效果。它由以下两部分组成:

  1. Wide 部分
    Wide 部分是一个广义线性模型,能够有效记忆历史交互特征或显式的特征组合。它擅长捕捉稀疏的、高维的特征和显式的交互特征,例如手工设计的交叉特征。

  2. Deep 部分
    Deep 部分是一个深度神经网络,用于自动学习特征的隐式表示和复杂的特征交互。通过嵌入层将稀疏特征转化为稠密向量,再通过全连接层捕捉高阶特征交互。

联合训练
Wide & Deep 模型的输出是两部分预测结果的加权求和,损失函数统一优化这两部分的参数:
y = σ ( Wide Output + Deep Output ) y = \sigma(\text{Wide Output} + \text{Deep Output}) y=σ(Wide Output+Deep Output)

应用场景
Wide & Deep 框架广泛用于推荐系统、广告系统等场景。例如,Google 在 Google Play 中使用该框架实现了大规模推荐,兼顾了推荐的精准性和泛化能力。

四、Wide & Deep 框架示例:电子商务推荐

场景
假设你在一个电子商务平台上,想要为用户推荐合适的商品。用户之前购买了一双运动鞋,接下来可能会感兴趣购买与运动相关的商品,比如运动服、运动背包等。

Wide 部分

  • Wide 部分利用显式的历史交互特征:
    • 用户购买了“运动鞋”。
    • 用户浏览过“运动服”相关的商品。
    • 用户搜索过“健身用品”。
  • Wide 模型通过手工设计的特征组合,比如:
    • (商品类型 = 运动鞋)AND(用户年龄 = 20-30)→ 运动服。
    • (商品品牌 = Nike)→ 推荐 Nike 的相关商品。

这些规则捕捉到用户行为和商品之间的显式关联,比如用户购买运动鞋后通常会购买运动服。

Deep 部分

  • Deep 部分利用用户和商品的隐式特征,通过深度学习模型进行高阶特征学习:
    • 用户的隐式特征:嵌入用户的兴趣、年龄、性别等信息。
    • 商品的隐式特征:嵌入商品的类型、品牌、价格等信息。
  • 深度模型通过神经网络学习复杂的用户行为与商品之间的潜在模式。例如:
    • 用户最近对“跑步健身”类的商品点击次数多,Deep 模型可以识别这一趋势并推荐跑步相关的商品,比如运动手表。

联合预测
最终,Wide 部分捕捉显式规则关系,Deep 部分学习隐式高阶特征交互,两者的输出结果相加,再通过 Sigmoid 函数计算推荐得分。比如:

  • 推荐运动服的得分为 0.85(高相关性)。
  • 推荐健身背包的得分为 0.70(中等相关性)。

总结
Wide 部分记住了明确的历史行为(规则记忆),Deep 部分则挖掘了隐式的复杂关系(泛化能力),两者结合使得推荐既精准又具备拓展性,从而满足用户的多样化需求。

五、词性(POS)标注特征 p i p_i pi 什么意思?

词性(Part-of-Speech, POS)标注是为句子中的每个单词分配一个对应的词性标签(如名词、动词、形容词等)。在序列标注任务中,词性特征 p i p_i pi 表示输入句子中第 i i i 个单词的词性信息,用于为模型提供额外的语法特征。


1. 为什么使用词性特征?
词性特征可以为序列标注任务(如命名实体识别、语义标注等)提供额外的上下文信息,帮助模型更好地理解单词的角色。例如:

  • 地名通常是名词(如“Paris”标注为名词)。
  • 动作类单词通常是动词(如“live”标注为动词)。
  • 介词和连接词可以暗示实体之间的关系(如“in”标注为介词)。

通过引入词性特征,模型可以学习到特定词性标签与目标标签(如命名实体类别)之间的关系。


2. 如何获取词性特征?

  1. POS 标注工具
    使用现成的 POS 标注工具(如 NLTK、Spacy 或 Stanford NLP)对句子进行词性标注。例如:

    • 输入句子:I live in Paris
    • POS 标签:I/PRP live/VBP in/IN Paris/NNP
      • PRP: 代词
      • VBP: 动词(非第三人称单数)
      • IN: 介词
      • NNP: 专有名词
  2. 特征表示
    POS 特征通常通过嵌入的方式表示:

    • 为每个 POS 标签分配一个独立的嵌入向量(类似于词嵌入)。
    • 例如,PRP -> [0.1, 0.2], VBP -> [0.3, 0.5],形成向量 p i p_i pi

3. POS 特征的作用
在序列标注任务中,POS 特征可以:

  • 提供单词的语法角色信息。
  • 增强模型对上下文的理解,特别是在区分模糊单词时。
  • 改善特定任务的性能,例如命名实体识别中地名(NNP)的识别。

4. 示例:POS 特征如何帮助命名实体识别
句子:I live in Paris

  • 词性标注:
    • x 1 = "I" x_1 = \text{"I"} x1="I", p 1 = PRP p_1 = \text{PRP} p1=PRP(代词)。
    • x 2 = "live" x_2 = \text{"live"} x2="live", p 2 = VBP p_2 = \text{VBP} p2=VBP(动词)。
    • x 3 = "in" x_3 = \text{"in"} x3="in", p 3 = IN p_3 = \text{IN} p3=IN(介词)。
    • x 4 = "Paris" x_4 = \text{"Paris"} x4="Paris", p 4 = NNP p_4 = \text{NNP} p4=NNP(专有名词)。

结合词性特征 p i p_i pi,模型可以学习到:

  • 代词和动词通常不是命名实体。
  • 专有名词(NNP)更可能是地名(如“Paris”)。

5. 最终输入表示
在模型中,词性特征 p i p_i pi 与单词嵌入 x i x_i xi 和其他特征(如字符嵌入 c i c_i ci)拼接形成最终的输入表示:
w i = [ x i ; c i ; p i ] w_i = [x_i; c_i; p_i] wi=[xi;ci;pi]
其中 p i p_i pi 提供了句法信息,帮助模型更准确地进行序列标注任务。

六、

七、

八、

九、

十、

十一、

十二、

十三、

根据我提供的论文,写出它的1、研究背景 2、论文贡献 3、方法框架 4、研究思路 5、实验 6、限制

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值