[思考记录.AI]Deepseek-R1的联网搜索，是什么？

俊哥V

已于 2025-02-15 16:32:48 修改

阅读量2.1k

点赞数 27

CC 4.0 BY-SA版权

分类专栏： AI 技术理解思考记录文章标签： AI 思考记录人工智能 deepseek

于 2025-02-15 16:09:21 首次发布

本文链接：https://blog.youkuaiyun.com/debug_fan/article/details/145649746

AI 同时被 3 个专栏收录

53 篇文章

订阅专栏

思考记录

29 篇文章

订阅专栏

技术理解

28 篇文章

订阅专栏

不知道有没有感受，在有了思维链加持的AI搜索（或者应该叫“被赋予在线搜索能力的思维链大模型”）之后，简单的资料搜索及信息整合轻松了很多。许多以前需要手工筛选、分析提炼和整合的事情，现在一个搜索直接搞定。

比如，想知道：DS-R1联网搜索是怎么实现的呢？通过询问在线版DS-R1直接就能得到整合好的信息：

联网搜索的实现可能包括以下几个步骤：

1. 用户查询解析：模型解析用户问题，推理用户想要了解的信息，并识别需要实时数据的部分。

2. 搜索关键词生成：模型生成适合搜索引擎的关键词或直接构造API请求。

3. 调用搜索引擎/数据库API：访问合作搜索引擎（如360搜索、微信生态内搜索）或专业数据库（金融、学术）。

4. 结果获取与过滤：获取搜索结果后，模型进行相关性排序，过滤掉不相关或低质量内容。

5. 信息整合与推理：将筛选后的信息结合模型自身的知识库，生成连贯回答。

6. 引用与展示：在回答中标注引用来源，如微信公众号文章链接或其他URL。

此外，不同平台可能有不同的实现方式，例如腾讯元宝优先使用微信生态内容，而天工AI接入学术数据库。同时，算力支持（如华为云、360的GPU集群）确保搜索过程的快速响应，避免官方服务器的卡顿问题。模型可能需要优化网络请求的并发处理和数据缓存机制，以提升效率。

当然，我们还是有必要思考验证一番：

一、判断以上信息是否靠谱。这点，通过查看DS-R1搜索答复中的思维链就可以做一些印证。
1.大模型回先理解并分析用户想要了解的信息。在思维链的开头，可以看到典型如：

用户想知道....
用户可能希望深入理解....
我现在需要回答用户关于....的问题
我现在需要帮助用户....

2.基于1，生成一些“查询任务”，用来帮助解答问题。在思维链中可看到典型如：

首先，我需要确认....
我需要理解什么是....
我应该明确....的基本概念
可能需要....等方面的信息

3.所谓的“查询任务”，应该是大模型生成了相关的“搜索关键词”，并调用搜索引擎/接口得到实时结果。在搜索结果中，也列出了相应的网页地址、内容概要。

4.大模型通过推理过滤出有用的搜索结果，包括验证实时性等。从思维链中可看到如：

时间方面，部分搜索结果的时间是2025-02-11或更早，而用户提问的时间是2025-02-15，因此所有信息都是最新的，可以全部参考。
用户给出的搜索结果有七个条目，发布时间从2025-01-21到2025-02-12，所以时间范围都在最近的一个月内，应该是相关的。

5.结合搜索结果，思考推理并做整合，包括可信度、正确性判断等。从思维链中可看到如：

查看搜索结果，发现多个结果提到....例如，结果1详细介绍了....需要将这些信息整合....
但具体的技术细节没有提到，可能需要参考其他搜索结果。
检查是否存在可能的误解：....是否可能有其他含义？在此上下文中，....符合搜索结果中的描述。
现在需要整合这些信息，并确保没有遗漏或矛盾。例如，搜索结果[3]和[5]提到....，而搜索结果[8]的....，因此可以确认....。而....，但可能有不同的....。

6.给出包含引用来源的最终答复

二、目前的DS-R1联网搜索，它本质上是什么呢？
大模型本身的预训练数据中并不包含最新的联网信息，并且大模型并不能直接联网搜索。那么，DeepSeek-R1 的联网版是个什么呢？从当前的理解看，其本质上应该算是一种“搜索智能体”（解决信息搜索场景的 AI Agent）：
1.大模型作为“大脑”提供认知能力（如语言理解、策略生成、分析推理）
2.搜索智能体通过工具调用（如联网搜索、数据库查询的等）扩大模型的知识边界，以及解决数据滞后问题。
结合起来，就实现了时效性更强的智能交互。

而这种“外接知识”的方式，也有个专门的叫法“RAG（检索增强生成）”。它是当前除了单纯的提示词工程、模型微调外的一种常见AI应用方式——RAG（检索增强生成）。比如接入本地知识库文档，打造专属问答助手。之前黄建华基于桥妹的检索，也是基于这个原理。

---------------------

最后，记录一些问题。可能值得持续思考：