Large Search Model: Redefining Search Stack in the Era of LLMs

828 篇文章

已下架不支持订阅

本文提出大型搜索模型框架,将搜索任务统一到一个大型语言模型中,简化传统搜索堆栈,利用LLM的自然语言理解和推理能力提高搜索质量。通过概念验证实验展示了其可行性,但也指出高推理成本和长上下文建模等挑战。

本文是LLM系列文章,针对《Large Search Model: Redefining Search Stack in the Era of LLMs》的翻译。

大型搜索模型:LLM时代的搜索堆栈重新定义

摘要

现代搜索引擎建立在一堆不同的组件之上,包括查询理解、检索、多级排名和问答等。这些组件通常是独立优化和部署的。在本文中,我们引入了一个新的概念框架,称为大型搜索模型,该框架通过将搜索任务与一个大型语言模型(LLM)统一来重新定义传统的搜索堆栈。所有任务都被公式化为自回归文本生成问题,允许通过使用自然语言提示来定制任务。该框架利用了LLM强大的语言理解和推理能力,在简化现有繁琐搜索堆栈的同时,提供了提高搜索结果质量的潜力。为了证实该框架的可行性,我们进行了一系列概念验证实验,并讨论了在现实世界的搜索系统中实现该方法的潜在挑战。

1 引言

2 相关工作

3 大搜索模型

4 概念验证实验

5 结论

本文引入了大型搜索模型框架来重新定义LLM时代搜索系统的技术堆栈。我们认为,LLM的独特特性允许对各种IR任务采用统一的建模方法,并提供改进的泛化能力,而不是微调和部署许多特定于任务的小型编码器-解码器或编码器模型。除了该框架的巨大潜力外,我们还讨论了一些需要进一步研究的新挑战,如高推理成本、长上下文建模和潜在的错位风险等。为了证明我们框架的可行性,我们进行了概念验证实验,尽管需要更大规模的评估来进行更全面的评估。
虽然现代搜索引擎在信息访问的民主化方面发挥了重要作用,但建立一个强大的搜索系统需要跨多个组件进行大量的工程工作,而且在许多情况下搜索结果仍然不令人满意。我们相信LLM的不断发展将为信息检索领域带来新的

已下架不支持订阅

PS C:\Users\15330\Desktop\ui界面测试> pylint mandala_tesk_2.py ************* Module mandala_tesk_2 mandala_tesk_2.py:43:0: C0303: Trailing whitespace (trailing-whitespace) mandala_tesk_2.py:50:0: C0303: Trailing whitespace (trailing-whitespace) mandala_tesk_2.py:1:0: C0114: Missing module docstring (missing-module-docstring) mandala_tesk_2.py:4:0: C0116: Missing function or method docstring (missing-function-docstring) mandala_tesk_2.py:4:15: W0621: Redefining name 'center' from outer scope (line 142) (redefined-outer-name) mandala_tesk_2.py:13:0: C0116: Missing function or method docstring (missing-function-docstring) mandala_tesk_2.py:13:23: W0621: Redefining name 'center' from outer scope (line 142) (redefined-outer-name) mandala_tesk_2.py:20:0: C0116: Missing function or method docstring (missing-function-docstring) mandala_tesk_2.py:20:28: C0103: Argument name "R" doesn't conform to snake_case naming style (invalid-name) mandala_tesk_2.py:20:0: R0913: Too many arguments (6/5) (too-many-arguments) mandala_tesk_2.py:20:0: R0917: Too many positional arguments (6/5) (too-many-positional-arguments) mandala_tesk_2.py:20:20: W0621: Redefining name 'center' from outer scope (line 142) (redefined-outer-name) mandala_tesk_2.py:20:28: W0621: Redefining name 'R' from outer scope (line 143) (redefined-outer-name) mandala_tesk_2.py:20:31: W0621: Redefining name 'r' from outer scope (line 144) (redefined-outer-name) mandala_tesk_2.py:20:34: W0621: Redefining name 'n' from outer scope
03-13
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值