RAG中embedding模型怎么选

Artiken

于 2024-10-27 21:17:41 发布

阅读量230

点赞数 4

文章标签： embedding

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_56583393/article/details/143274909

版权

一般情况下先看几个硬性指标：

①token长度限制：

一般超出这个限制则会导致模型对文本进行截断，从而丢失信息，影响下游任务的性能。不过实际切片中太长容易信息干扰，太短容易断章取义，一般都取500token左右+100token左右的重叠。

②资源需求：

高维向量需要更多的存储空间，这可能会带来长期成本。另外更大的模型可能会占用更多内存。

③模型响应时间：

RAG链路中，虽然响应时间与模型处理时间比九牛一毛，但对于某些场景来说，每一步的延时都至关重要。

④垂直领域：

如医学、法律和金融等领域通常需要专门训练 Embedding 模型来捕捉特定的专业术语和语境。

embedding模型最主流评估 Benchmark：MTEB。MTEB 涵盖了 8 个嵌入任务，包括双语挖掘(Bitext Mining)、分类、聚类、成对分类、重新排序、检索、语义文本相似度（STS）和摘要。它涵盖了总共 58 个数据集，跨越了 112 种语言。

实际业务场景中如何评价一个embedding模型的好坏：

（1）不考虑排名的指标

- 上下文召回率：检索到的内容中有用的信息/所有有用的信息

- 上下文精确率：检索到的内容中有用的信息/所有检索到的信息

（2）考虑排名的指标

- 平均精确率（AP）：检索到的信息中有用的信息的排名，如果有用信息都在前面排名就高

- 倒数排名（RR）：第一个有用块出现的位置的倒数，例如第一个信息就有用就是1，在第二个出现就是1/2。

- 归一化折扣累积增益：考虑了信息的相关性不是只有“有”或“没有”，而是根据不同程度的相关性。它衡量的是找到的信息的相关性是否按照重要性排序。如果重要信息排在前面，这个指标就高。

#最后，实在不知道选什么模型的话中文可以优选bge，效果不错而且开源

博客等级

码龄4年

24
原创

105
点赞

55
收藏

56
粉丝

关注

私信

热门文章

最新评论

ResNet结合Transformer，暴力涨点新思路！
2401_87605264: 你好，怎么获得
ResNet结合Transformer，暴力涨点新思路！
zmhcj: 你好，请问有没有resnet结合tranformer实现高分辨率图像的语义分割
为什么transformer用softmax而非sigmoid ？
ha_lydms: 优质好文支持支持,优质好文支持支持
大模型面经：bert和gpt区别
Artiken: https://www.xiaohongshu.com/explore/66f669f9000000001b020fb6?app_platform=android&ignoreEngage=true&app_version=8.55.2&share_from_user_hidden=true&xsec_source=app_share&type=normal&xsec_token=CBHMB02DmVSJO0C15X_6xgCJBf-FBuD8736hU_UM13ics=&author_share=1&xhsshare=Weixin补上失误实验Session&shareRedId=ODY0MTU6R0A2NzUyOTgwNjY0OTc6PT85&apptime=1727542285&share_id=371360bbb65a4fe69d4986b7151d631b&wechatWid=635a82bb43153a078fdac5d844f9bfeb&wechatOrigin=menu

大家在看

学习STC51单片机16（芯片为STC89C52RCRC）

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。