在使用 Dify 构建基于 RAG(Retrieval-Augmented Generation)知识问答系统时,你可能会遇到这样一个让人费解的问题:
同样的问题,加个问号「?」结果就不一样!
比如:
-
输入
公司注册资本要求
返回内容清晰详细。 -
输入
公司注册资本要求?
返回却很简略或答非所问。
这背后到底发生了什么?RAG 系统真的“看不懂”标点符号?其实,这与 RAG 的检索策略、系统提示词设计(system prompt),以及文档分段逻辑密切相关。
本文将从原理入手,逐步解析为何问号会影响回答质量,并提供实用优化建议,帮助你构建更稳定、更一致的问答体验。

一、RAG 中“问号”触发问题的根本原因
1. 关键词匹配敏感:Embedding 检索机制的本质
Dify 使用向量化(embedding)方式进行语义检索,但检索前会对输入进行语义编码。如果加了问号,句子被转换成的 embedding 向量可能发生细微偏移,导致与知识块的匹配度下降。
✅ 语言模型对
公司注册资本要求</
订阅专栏 解锁全文
1275

被折叠的 条评论
为什么被折叠?



