1. 传统 RAG 的局限与联网搜索的必要性
想象一下,你正在使用一个基于内部产品文档的 RAG 助手,但想问:
- “你们最新发布的 X 型号和竞争对手 Y 公司的 Z 型号相比,哪个性价比更高?” (需要竞争对手的最新信息)
- “最近关于人工智能伦理的讨论有哪些新进展?” (需要最新的新闻和观点)
- “今天北京的天气怎么样?” (需要实时的、动态的数据)
- “介绍一下上周刚成立的某某创业公司。” (知识库可能尚未收录)
传统 RAG 在这些情况下可能会失败,因为它依赖的知识库是:
- 静态的 (Static):知识库通常是离线构建和索引的,无法实时更新。
- 有限的 (Limited Scope):知识库通常聚焦于特定领域或组织内部,无法覆盖互联网上的海量信息。
- 滞后的 (Outdated):即使定期更新,知识库内容也可能滞后于快速变化的世界。
联网搜索的引入,正是为了弥补这些不足:
- 时效性 (Timeliness):获取最新的新闻、事件、产品发布、研究进展等。