还在排队 SearchGPT?快来试试 MindSearch!

7 月 25 日,OpenAI 发布了其 AI 搜索的原型系统 SearchGPT,在社区引起轰动。社区小伙伴们纷纷加入了排队试用的名单。SearchGPT 将 LLM 和搜索引擎结合,试图成为我们搜集信息、探索知识、解决问题的重要工具。然而,鉴于年初的 Sora 到目前都还没未真正实现大规模体验,也有网友对今年用上 SearchGPT 持悲观态度。既然 SearchGPT 可能遥遥无期,那我们有没有开源平替免费尝鲜呢?今天,有了!

2024 年 7 月 4 日,上海人工智能实验室联合研发团队发布了书生·浦语 2.5,以大规模信息搜集整理为典型场景,展示了 InternLM2.5 在复杂任务场景下的强大能力,首次实现从上百个网页中进行自主信息搜集整理。开源的 InternLM2.5 7B 对话模型能够在 3 分钟内主动从 300+ 网页中搜集整理有效信息,总结归纳,解决人类需要 3 小时才能完成的任务。这一突破不仅有效拓展了大语言模型的知识和能力边界,同时也是团队基于多智能体框架解决复杂专家任务的全新尝试。今天,研发团队正式公开其背后的技术方案,并全栈开源了相关工具链,让你在家就能免费用上 SearchGPT 的开源平替!

项目主页:MindSearch — Search Engine + LLM Agents = Answer Engine

技术报告:https://arxiv.org/abs/2407.20183

在线 Demo:https://mindsearch.openxlab.org.cn/

开源代码:GitHub - InternLM/MindSearch: a LLM-based Multi-agent Framework of Web Search Engine similar to Perplexity.ai Pro and SearchGPT

先来看几个例子

书生·浦语团队提出了 MindSearch(思·索)框架,在网络信息搜集与整合任务上,模拟了人类解决复杂信息搜集任务的过程。

如下面的视频所示,对于多步骤的复杂问题,模型能够分析用户需求,先搜索嫦娥 6 号的技术难点、再针对每一个技术难点搜索对应的解决方案,再从任务目标、技术手段、科学成果、国际合作 4 个方面对比阿波罗 11 号登月计划,最后总结我国探月成功的贡献。

视频封面

MindSearch 依靠其独特的路径建模方式在 agent 层面上进行并发,在 3 分钟内就阅读了 300+ 相关网页,给出了最终的答案。而且,与其他 AI 搜索引擎不同的是,MindSearch 完全对外展示了问题解决过程中的 AI 的思考过程和搜索中间结果,用户可以根据自己的需要查看每一次的搜索过程和模型阅读的网页,增加了对整个内容的可解释性和可信度。

我们还可以尝试用 MindSearch 了解巴黎奥运会的最新情况,如下面的视频所示,我们询问“巴黎奥运会正在火热进行,巴黎一共举办过几届奥运会了?每届巴黎奥运会的情况分别是啥样的?今年巴黎奥运会开幕式有什么亮点?”,模型能够首先查询巴黎奥运会历史,然后再查询 3 次奥运会的详情,最后形成最终回复。

视频封面

主观体验显优势

和现有的 AI 搜索引擎技术相比,MindSearch 因为采用了多智能体框架和模拟了人的思维过程,会先对问题进行拆解和规划,因此在回答的信息准确性、完整性和时效性上具有显著的优势。例如我希望知道王者荣耀当前赛季哪个射手最强,Perplexity.ai 会直接将这个问题交给搜索引擎并基于搜索结果给出回复,而 MindSearch 则会在思考规划之后,先查询当前赛季的信息,再基于赛季信息进行进一步检索。而针对更加复杂的问题,如近三年全球各大电影节的获奖影片名单,MindSearch 也能先了解全球电影节,然后对各电影节按年份进行完整搜索,而 Perplexity.ai 则无法完整地进行规划。

在研发团队进行的主观评测上,基于 InternLM2.5-7B-Chat 模型的 MindSearch 不管在回答问题的宽度、广度还是事实性层面,相对 Perplexity.ai 都能展现出明显优势。

思·索:先‘思’再‘索’

显著的优势和突破源自研发团队对复杂信息搜集整理任务的深刻认知。现有的 AI 搜索引擎如 Perplexity.ai 主要依靠大语言模型对搜索结果进行总结回复,在面对更大规模的信息搜集整理任务时,需面对三重挑战:

(1)搜索引擎难以一次性精确返回复杂请求所需的全量网络信息

(2)待整合的信息散布在多个网页中,信息非常嘈杂

(3)大量的网络内容很容易超过 LLM 可处理的上下文长度

为了解决这些难题,研发团队提出了名为 MindSearch (思·索)的多智能体框架。顾名思义,MindSearch 模拟人的思维过程,先对问题进行充分的“思”考,再进行完整的信息搜“索”,同时将整个系统设计成“思”和“索”两个智能体进行分工协作,交互完成任务。

如上图所示,由规划器专注“思”考,分析问题、拆解任务,并将任务分配给检索器。而检索器负责层次化检“索”网络信息,并回答每个子问题。于此同时,MindSearch 的多智能体设计也将处理大量信息的负载分配给了不同的智能体,使得整个框架能够处理更长的上下文(超过 300 个网页)。

全栈开源,赋能社区

早在 7 月 4 日,研发团队已经开源了 InternLM2.5-7B-Chat 模型,InternLM2.5-7B-Chat 针对 MindSearch 框架进行了完整优化,支持 MindSearch 完成 300+ 网页信息搜集。

今天,研发团队公开 MindSearch 的完整前后端实现,基于智能体框架 Lagent,支持用户本地部署模型和应用。

MindSearch 链接:GitHub - InternLM/MindSearch: a LLM-based Multi-agent Framework of Web Search Engine similar to Perplexity.ai Pro and SearchGPT

在下载好 MindSearch 的 GitHub 仓库后,用户可以在项目中使用如下命令直接体验 MindSearch:

# 启动服务
python -m mindsearch.app

## 一键启动多种前端
### 1. React
npm install
npm start
### 2. Gradio
python frontend/mindsearch_gradio.py
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值