稀疏向量检索：双塔模型和稠密向量检索：单塔模型

最新推荐文章于 2025-07-14 12:57:06 发布

原创

最新推荐文章于 2025-07-14 12:57:06 发布 · 1.9k 阅读

·

6

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

本文介绍了计算机科学中稀疏和稠密向量检索的双塔模型（用户塔和物品塔）和单塔模型（共享塔），分析了它们在推荐系统和深度学习中的应用，以及在训练和检索阶段的工作原理。双塔模型适用于稀疏数据，强调效率；单塔模型适用于稠密数据，注重表示学习的灵活性。

“稀疏向量检索：双塔”和“稠密向量检索：单塔”是指在计算机科学中，尤其是信息检索、推荐系统、深度学习等领域中，使用特定模型结构进行向量表示和检索的方法。这里的“塔”并不是指物理意义上的塔楼，而是借用建筑学的术语来形象地描述模型结构。下面分别解释这两种结构在稀疏向量检索和稠密向量检索中的应用：

稀疏向量检索：双塔模型

双塔模型常用于处理稀疏向量（如高维、大部分元素为零的特征向量，如用户-商品交互矩阵、词袋模型的文本向量等）的检索任务，特别是在推荐系统中。双塔模型通常包含两个相互独立的神经网络塔：

用户塔（User Tower）：负责对用户侧的特征进行编码，生成用户向量表示。这些特征可能包括用户的属性（如年龄、性别）、历史行为（如浏览、购买记录）等。
物品塔（Item Tower）：负责对物品侧的特征进行编码，生成物品向量表示。这些特征可能包括物品属性（如类别、品牌）、文本描述、标签等。

在训练阶段，双塔模型通过最大化用户向量与对应正样本物品向量的内积（或相似度度量），同时最小化用户向量与负样本物品向量的内积，来学习有效的用户和物品表征。这样，用户和物品就被映射到了同一个隐含特征空间中。

在推理阶段（即检索阶段），给定一个用户，可以通过用户塔得到其向量表示，然后与所有物品向量（由物品塔预先计算得到并存储）计算相似度，从而快速找出与该用户最相关的物品，完成检索任务。由于用户塔和物品塔相互独立，且在实际应用中往往只需要对物品塔进行一次预计算，这种结构有利于大规模数据下的高效检索。

稠密向量检索：单塔模型

单塔模型常用于处理稠密向量（如通过深度学习模型生成的低维、连续且大部分元素非零的特征向量，如词嵌入、深度特征提取等）的检索任务。单塔模型只有一个共享的神经网络结构：

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。