问题一:内容缺失问题
当实际答案不在知识库中时,RAG系统往往给出一个貌似合理却错误的答案,而不是承认无法给出答案。这导致用户接收到误导信息,造成错误的引导。
如何解决:
1、优化数据
“输入什么,输出什么”如果源数据质量差,比如充斥着冲突信息,那么无论你如何构建RAG流程,都不能从杂乱无章的数据中得到有价值的结果;
2、改进提示方式
在知识库缺乏信息,系统可能给出错误答案的情况下,改进提示方式可以起到显著帮助。
问题二:错过排名靠前的文档
有时候系统在检索资料时,最关键的文件可能并没有出现在返回结果的最前面。这就导致了正确答案被忽略,系统因此无法给出精准的回答。即“问题的答案其实在某个文档里面,只是它没有获得足够高的排名以至于没有呈现给用户”
如何解决:
1、重新排名检索结果
在将检索到的结果发给大模型之前,对结果进行重新排名可以显著提升RAG的性能。
2、调整数据块大小(chunk_size)和相似度排名(similarity_top_k)超参数
chunk_size和similarity_top_k都是用来调控 RAG(检索增强型生成)模型数据检索过程中效率和效果的参数。改动这些参数能够影响计算效率与信息检索质量之间的平衡。
问题三:未能提取答案
当系统需要从提供的上下文中提取正确答案时,尤其是在信息量巨大时,系统往往会遇到困难。关
键信息被遗漏,从而影响了回答的质量。“这种情况通常是由于上下文中存在太多干扰信