手搓RAG实体识别第四天

RAG实体识别优化与实践

接之前的流程,构建本体库后,根据llm识别到的实体片段,然后在向量数据库中进行相似度检索,将检索到的片段再次交给大模型进行选择,让大模型做选择而不是生成,真的可以很好的减少幻觉的出现,可以提高准确率。

现在实体识别的准确率有了很大的提高,然后将识别到实体和原来的文本内容,一起发给大模型进行值抽取(之前是将文本内容分块,然后向量化,最后根据检索到的实体进行相似度匹配),但是我发现这样容易漏掉一部分关键信息,导致值抽取不准确;加上文本内容不是很长,我就去掉了这部分的向量化和rag流程,直接全文输入,这样值抽取的准确度也能有效的提升(但是会相对于的浪费一些token和增加一些时间)。

想到哪里写到哪里吧,感谢大家观看,请大家多多指正。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值