Quintin.Tao-优快云博客

原创 Rag-Embeding模型最佳实践-text-embeddings-inference 搭建(一、GPU)

3.3 设置 crates.io 镜像，修改配置 ~/.cargo/config，已支持git协议和sparse协议，>=1.68 版本建议使用 sparse-index，速度更快。如果是自己服务器，我会设置cargo_home rustup_home 之类的配置，避免把包全搞到跟目录，后续难受。这里比git 上多加了一个--features static-linking，原因是本地报错，具体可以参考我这篇文章。1.下载指定版本的text-embeding-inference，这里下载v1.7.0版本。

2025-05-13 20:27:10 390

原创编译 text-embeddings-inference遇到的问题总结

编译 text-embeddings-inference遇到的问题总结

2025-05-10 15:51:01 490

原创 RagFlow-v0.18.0 新特性-6管理员可以通过环境变量启用或禁止用户注册。

RagFlow-v0.18.0 新特性-6管理员可以通过环境变量启用或禁止用户注册

2025-05-02 13:00:54 430 1

原创 RagFlow-v0.18.0新特性-5 通过 OpenAI 的 API 进行Agent调用

RagFlow-v0.18.0-5 通过 OpenAI 的 API 进行Agent调用

2025-05-02 12:04:29 558

原创 RagFlow-v0.18.0 新特性-4 Agent 分享

RagFlow-v0.18.0 新特性-4 Agent 分享功能使用

2025-04-28 16:36:13 207

原创 RagFlow-v0.18.0 新特性-3 Agent 版本控制

RagFlow 0.18.0版本特性 Agent 版本控制

2025-04-28 11:20:50 317

原创 RagFlow-v0.18.0 新特性-2 文档布局识别过程中采用 VLM 模型作为处理流水线，从而实现对 PDF 中图像的深度分析

这里嵌入模型使用的是通过xinference 部署的embeding和Rerank 模型，因为部署简单，使用的资源也少，2G 显存就OK ，推荐有显卡资源的自己部署一下，后续专门写一篇。由于上面的PDF 超过了5M 导致silionflow.cn 报错了，(这里我还发现一个Bug.)我更换了PDF，当使用VL模型进行解析的时候。我到0.17.2版本去试了一下，发现的确用不了外部的VL 模型。最后成功解析出来结果，下面对比一下用VL 模型的解析结果和不用VL模型的区别。1.使用VL 模型进行解析的问答结果。

2025-04-26 12:22:13 962