RAG通病:这问题没问到我心趴上

这问题没问到我心趴上

最近一直在捣鼓基于RAG的客群圈选的规则推荐,因为是基于“标签”的客群圈选,所以我一开始把所有的“标签”、“标签值”、“客群知识库”的表格全部一股脑丢了进去,最后发现效果非常的差。
我这里使用Dify智能体进行测试,经过我的几次调试还是找不到最根本的原因,一开始以为是知识库不够庞大没有覆盖到场景,但是当我问知识库覆盖的一些问题的时候才发现也经常出现离谱的回答。
于是我开始一步步的拆解,到底哪里出了问题,直到我开始测试知识库检索的部分,才发现检索出来的结果都不是我想要的。

处理前

所以我得出一个无厘头的结论:这问题没问到我心趴上
当我们的输入为:”请你帮我圈一个年轻男性吧“的时候,整个问题文本都会被当成向量去匹配,这时候会发现他匹配不到”年轻“、”男性“,因为”请你帮我圈一个“、”吧”这些干扰项都被当成检索内容去检索,解决的办法就是提前从自然语言中提取关键词

小参数大模型提取关键词

最开始想过使用python实现简单的分词,但是分词本身没有语义理解能力,不能够剔除无用的词语,所以后面就采用小参数大模型提取关键词方式进行测试。

通过小参数大模型提取关键词

系统提示词:​你是专业提取文本关键词的助手,用来做客群圈选前的向量检索,多个请用逗号","分割,要求返回只包含关键词本身,精简无废话,并且去掉一些关于”客群“等无用的词语,如果提取不到结果则原文返回即可。

提取结果

经过测试qwen2.5至少使用qwen2.5:1.5b才能正确处理我提出的关键词提取的需求,并且需要通过Dify工作流的方式实现。

Dify工作流

检索的结果相对比较合理了,小参数的大模型也能给出比较好的回答了,但是“知识库”的构建还是存在一些问题,存在大量的相似的结果,但是他们可能是不同场景下的,最后导致把小参数的大模型带跑偏了。

【SCI级别】多策略改进鲸鱼优化算法(HHWOA)和鲸鱼优化算法(WOA)在CEC2017测试集函数F1-F30寻优对比内容概要:本文档主要介绍了一项关于多策略改进鲸鱼优化算法(HHWOA)与标准鲸鱼优化算法(WOA)在CEC2017测试集函数F1-F30上进行寻优性能对比的研究,属于智能优化算法领域的高水平科研工作。文中通过Matlab代码实现算法仿真,重点展示了HHWOA在收敛速度、寻优精度和稳定性方面的优势,体现了多策略改进的有效性。该研究适用于复杂优化问题求解,尤其在工程优化、参数辨识、机器学习超参数调优等领域具有应用潜力。; 适合人群:具备一定算法基础和Matlab编程能力的研究生、科研人员及从事智能优化算法开发与应用的工程技术人员,尤其适合致力于SCI论文写作与算法创新的研究者。; 使用场景及目标:①用于理解鲸鱼优化算法的基本原理及多策略改进思路(如种群初始化、非线性收敛因子、精英反向学习等);②为智能优化算法的性能测试与对比实验提供CEC2017标准测试平台的实现参考;③支撑学术研究中的算法创新与论文复现工作。; 阅读建议:建议结合提供的Matlab代码进行实践操作,重点关注HHWOA的改进策略模块与WOA的差异,通过重复实验验证算法性能,并可将其思想迁移至其他优化算法的改进中,提升科研创新能力。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值