ragflow
文章平均质量分 96
ragflow相关的使用
5ycode
公众号5ycode,
所有内容公众号最先发布,请大家尊重原创
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
沉寂数月的 Ragflow 重磅发布 0.20.0,补齐最大短板!
RagFlow近期迎来重大版本更新,重点改进了Agent功能和MCP支持。Agent方面进行了全面重构,新增多Agent协作、规划反思、视觉处理等功能,并优化了前端编排体验和可观测性。MCP功能实现完整闭环,支持服务端导入、客户端调用及RAGFlow作为服务端。更新还包含新版Infinity集成、API文件引用支持等特性。作者通过艾灸应用案例演示了Human-in-the-loop交互流程,详细讲解了开始节点设置、条件判断、Agent工具调用等关键环节。同时介绍了MCP服务的配置使用方法,并对比了RagFl原创 2025-08-04 16:39:56 · 1440 阅读 · 0 评论 -
RAGFlow 0.18.0 实战解读:从 MCP 支持到插件配置的全流程揭秘(源码)
RAGFlow 0.18.0版本发布,主要新增了MCP功能,允许通过MCP访问知识库。其他改进包括团队协作、Agent版本管理、兼容OpenAI API模型、PDF解析增强等。文章详细介绍了如何手动开启MCP服务并应用于Cherry Studio和VSCode,同时分析了源码中的RAGFlowConnector实现。MCP作为知识库访问接口,为开发者提供了更多集成可能性,但项目目前参与者较少,部分功能仍在完善中。原创 2025-06-21 11:33:36 · 1707 阅读 · 0 评论 -
RAGFlow核心引擎DeepDoc之PDF解析大起底
本文深入解析RAGFlow中的deepdoc模块,重点介绍了pdf文档解析器的实现细节。deepdoc包含parser(文档解析器)和vision(视觉处理)两大核心功能,其中pdf解析是最复杂的部分。文章详细剖析了PdfParser类的设计架构,包含PlainParser(基础文本提取)、RAGFlowPdfParser(核心处理流水线)和VisionParser(视觉扩展)三个类,它们通过统一的__call__方法返回标准化结果。还具体讲解了初始化过程如何加载OCR引擎、布局识别模型、表格结构识别器等关原创 2025-06-21 11:04:36 · 1433 阅读 · 0 评论 -
深度拆解RAGFlow分片引擎之切片实现
本文深入解析了RAGFlow的文档处理核心组件deepdoc,重点介绍其pdf解析器的实现。文章指出deepdoc包含parser(文档解析)和vision(视觉处理)两大模块,其中pdf解析是最复杂部分。通过源码分析展示了PdfParser类的整体架构,包括三个实现类:轻量级文本提取工具PlainParser、核心处理器RAGFlowPdfParser和功能扩展VisionParser。详细解读了初始化方法__init__的资源加载逻辑和标准解析流程__call__的实现方式,揭示了文档解析、布局分析、表原创 2025-06-21 10:31:16 · 1264 阅读 · 0 评论 -
深度拆解RAGFlow分片引擎!3大阶段+视觉增强,全网最硬核架构解析
上次讲解代码以后,把rag这块遗留了下来,rag的代码相对来说比较复杂,一环套一环。我们今天先来拆解下分片的整体流程。在最新的版本中,使用视觉模型,对图表进行增强。在这个方法里根据切片配置进行了处理。通过最近的源码解析,ragflow后面的升级有几块。点击文档后面的启动按钮。这里只是把切片的配置做了设置。我们从接口的请求参数和界面对照,大致了解下。执行run_graphrag。我们看下默认分片中的关键方法。执行run_raptor。deepseek相关资料。PDF解析器+布局识别。GraphRAG模式。原创 2025-04-16 19:20:07 · 2040 阅读 · 0 评论 -
解剖RAGFlow!全网最硬核源码架构解析
api可能是二开最常用的模块了。apps目录主要是 ragflow对外暴露的接口sdk目录是对外提供的api,主要是操作知识库和一些扩展*_app.py的文件都是对ragflow的web提供的接口db目录是操作数据库的封装utils是封装的一些工具。原创 2025-04-09 14:06:38 · 2779 阅读 · 0 评论 -
从代码逆向RAGFlow架构:藏在18张表里的AI知识库设计哲学
想要了解ragflow,表结构永远是绕不过去。我们连上ragflow的数据库,可以看到,创建有18张表。这些表具有什么含义?今天我们结合ragflow的代码、功能、和表来看一看。在ragflow的代码中,我们先看一下ragflow封装的继承关系。TextFieldMYSQLPOSTGRESJSONFieldListFieldragflow通过BaseModel把数据库的操作基于Peewee ORM进行了封装。原创 2025-04-08 18:10:05 · 2260 阅读 · 0 评论 -
从8550秒到608秒!RAGFlow最新版本让知识图谱生成效率狂飙,终于不用通宵等结果了
在ragflow的官方中,关于知识图谱,主要有两个文档,主要内容从0.9.0开始引入依赖于大模型和专有数据库infinity主要增强多跳问答和跨文档查询从v0.16.0版本开始,RAGFlow支持在知识库上构建知识图谱文档中的流程图不再依赖infinity想深读了解的,可以看看我们看下耗时对比。版本构建耗时降幅v0.17.08550秒v0.17.11440秒83%↓v0.17.2608秒58%↓我们可以看到知识图谱的构建是非常花费时间和tokens的。原创 2025-03-31 10:32:59 · 2208 阅读 · 0 评论 -
RAGFlow爬虫组件使用及ragflow vs dify 组件设计对比
上周末,两台电脑都失联了,一个是断网了,一个被我不小心关机。导致我两天没环境。只能整理,学点东西。上周有个有个群友问我ragflow爬虫的没法使用的问题。幸好周六早上的时候实践了下。原创 2025-03-19 19:43:24 · 2303 阅读 · 0 评论 -
亲测有效!Win10环境下RAGFlow全栈配置教程(附避坑指南)
做环境管理,单一的python还好一些,我之前安装的是3.9(比较早了)。而有些项目需要3.10,有的需要3.11,有的需要3.12,要么升级,要么安装多套环境。不想用uv,使用conda,建议让kimi写个脚本,把uv.lock里的包都洗出来,洗成。如果你没有修改过docker部署的端口,可以直接使用,如果修改了,需要对应的修改。然而我折腾了一会,安装不上。前端环境需要npm,或者pnpm,我之前一直有对应的环境,我就不折腾了。如果大家自己折腾,建议用uv,直接导入官方提供的,缺有,但是不多。原创 2025-03-17 08:11:57 · 6027 阅读 · 10 评论 -
DeepSeek+ragflow构建企业知识库之工作流,突然觉的dify又香了
我们按照下图的数据介绍组件。ragflow的的官方文档相对来说还是比较欠缺的,特别是用户交互这块。ragflow的ui使用成本相对比较高,组件不知道返回什么,只能根据示例或意图推断使用ragflow建议是有技术底子的英文文档的描述习惯和中文还是有很大的差别的说实话,用着有点崩溃,哈哈。原创 2025-03-05 10:01:09 · 1993 阅读 · 0 评论 -
DeepSeek+ragflow构建企业知识库:高级应用篇,越折腾越觉得ragflow好玩
从知识检索测试来说,开启知识图谱的检索效果最好。从聊天效果来说,反而通用的更符合我的口味。我的需求不明确,只是随意拿着一份文档测试,测试没有目标性,只是体验下检索的效果以及差异性,这个需要专业的测试。原创 2025-03-05 10:02:36 · 2099 阅读 · 0 评论 -
dify外挂ragflow+千问QWQ,解决dify解析和检索短板
之前一直有粉丝留言说让我出一个dify+ragflow的教程,今天来实操下。原创 2025-03-07 09:42:44 · 2329 阅读 · 8 评论
分享