接之前的流程,构建本体库后,根据llm识别到的实体片段,然后在向量数据库中进行相似度检索,将检索到的片段再次交给大模型进行选择,让大模型做选择而不是生成,真的可以很好的减少幻觉的出现,可以提高准确率。
现在实体识别的准确率有了很大的提高,然后将识别到实体和原来的文本内容,一起发给大模型进行值抽取(之前是将文本内容分块,然后向量化,最后根据检索到的实体进行相似度匹配),但是我发现这样容易漏掉一部分关键信息,导致值抽取不准确;加上文本内容不是很长,我就去掉了这部分的向量化和rag流程,直接全文输入,这样值抽取的准确度也能有效的提升(但是会相对于的浪费一些token和增加一些时间)。
想到哪里写到哪里吧,感谢大家观看,请大家多多指正。
RAG实体识别优化与实践
417

被折叠的 条评论
为什么被折叠?



