将重排模型构建成可以API调用的服务

最新推荐文章于 2025-06-12 20:03:38 发布

zhych0828

最新推荐文章于 2025-06-12 20:03:38 发布

阅读量735

点赞数 3

CC 4.0 BY-SA版权

文章标签： python 语言模型 AIGC docker 人工智能 java 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/zhych0828/article/details/144785193

将重排模型构建成可以API调用的服务

一、前言
- 1. 什么是重排模型
- 2. RAG为什么需要重排模型？
二、构建过程
三、功能测试
四、源码

一、前言

1. 什么是重排模型

重排序模型（Re-ranking Model）是一种在初步筛选（检索）之后对候选结果进行二次排序的模型。在信息检索（IR）和自然语言处理（NLP）中，重排序是一个常见的过程，尤其在生成和检索相关任务中，主要用于提升最终结果的质量。
通常，重排序模型会基于某些特定的特征或算法对候选结果进行进一步的评估和排序。通过这个过程，模型能够将最相关的结果置于前面，从而提升检索结果的质量。

2. RAG为什么需要重排模型？

在 RAG（Retrieval-Augmented Generation）中，重排序模型扮演着非常关键的角色。RAG 是一种结合了信息检索和生成的混合模型，它将从外部知识库（例如文本数据集）中检索到的文档与生成模型的能力结合在一起，从而增强了模型生成更准确、更具信息量的回答的能力。

二、构建过程

依赖安装和下载请参看向量模型的相关知识，这里我使用的模型是bce-reranker-base_v1。

import os
from typing import List
import uvicorn
from BCEmbedding import RerankerModel
from fastapi import FastAPI, Depends, HTTPException, status
from fastapi.security import HTTPBearer, HTTPAuthorizationCredentials
from pydanti

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄14年

16
原创

93
点赞

130
收藏

61
粉丝

关注

私信

热门文章

上一篇：: 将向量模型构建成可以Java调用的api服务

下一篇：: Docker compose安装elasticsearch8.13

最新评论

Dify修改nginx访问端口
2401_89281250: 我搭建的70B模型，访问端口号是默认80端口号，内部直接输入IP就能进入web界面，外部访问需要IP加端口号，现在需要开通外部访问策略，但是80端口不让开通，需要更改端口号，这个怎么更改
Dify修改nginx访问端口
weixin_4476484: 请问您这个问题解决了吗？我现在也是在发布运行是URL端口地址变回80
springboot结合ES8向量检索实现智能客服
qsscyyn5577: 大佬，已三连求源码麻烦发下邮箱1454249599@qq.com
springboot结合ES8向量检索实现智能客服
小胖子胖胖胖: 已三连，求源码
Dify修改nginx访问端口
vectoru: 是的，我之前也是用这个方法，但是测试api时经常出现几个 event: ping 后才有流式响应消息，我以为不行就改了SERVICE_API_URL和 APP_API_URL和各种端口，后来以为改好了没想到还是会出现，最后发现 event: ping 只是保持连接，真正耗时的是每次调用大模型ollama都重新启动，现在还没解决，只是大概确认了docker-compose.yml里面的端口都不用改

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

zhych0828 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。