- 博客(9)
- 收藏
- 关注
原创 Rag-Embeding模型最佳实践-text-embeddings-inference 搭建(一、GPU)
3.3 设置 crates.io 镜像, 修改配置 ~/.cargo/config,已支持git协议和sparse协议,>=1.68 版本建议使用 sparse-index,速度更快。如果是自己服务器,我会设置cargo_home rustup_home 之类的配置,避免把包全搞到跟目录,后续难受。这里比git 上多加了一个--features static-linking,原因是本地报错,具体可以参考我这篇文章。1.下载指定版本的text-embeding-inference,这里下载v1.7.0版本。
2025-05-13 20:27:10
390
原创 RagFlow-v0.18.0 新特性-6管理员可以通过环境变量启用或禁止用户注册。
RagFlow-v0.18.0 新特性-6管理员可以通过环境变量启用或禁止用户注册
2025-05-02 13:00:54
430
1
原创 RagFlow-v0.18.0新特性-5 通过 OpenAI 的 API 进行Agent调用
RagFlow-v0.18.0-5 通过 OpenAI 的 API 进行Agent调用
2025-05-02 12:04:29
558
原创 RagFlow-v0.18.0 新特性-2 文档布局识别过程中采用 VLM 模型作为处理流水线,从而实现对 PDF 中图像的深度分析
这里嵌入模型使用的是通过xinference 部署的embeding和Rerank 模型,因为部署简单,使用的资源也少,2G 显存就OK ,推荐有显卡资源的自己部署一下,后续专门写一篇。由于上面的PDF 超过了5M 导致silionflow.cn 报错了,(这里我还发现一个Bug.)我更换了PDF,当使用VL模型进行解析的时候。我到0.17.2版本去试了一下,发现的确用不了外部的VL 模型。最后成功解析出来结果,下面对比一下用VL 模型的解析结果和不用VL模型的区别。1.使用VL 模型进行解析的问答结果。
2025-04-26 12:22:13
962
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人