任务执行系统
任务执行系统是 RAGFlow 的主要后台处理引擎,负责文档解析、分块、嵌入生成和知识图谱构建。该系统是围绕 TaskExecutor 类构建的,并使用分布式工作器架构和基于 Redis 的任务队列。
任务执行器架构

任务执行器作为具有多个并发工作线程的分布式系统运行。每个工作线程最多可以处理 MAX_CONCURRENT_TASKS 个(默认为 5 个)并发任务,并针对不同作(如块构建 (MAX_CONCURRENT_CHUNK_BUILDERS)和 MinIO 作 (MAX_CONCURRENT_MINIO) 进行专门的速率限制。
任务类型和处理流程
系统支持多种类型的单据处理任务:

FACTORY 字典将解析器类型映射到其相应的处理模块,允许根据内容类型动态选择文档处理策略。
服务层架构
RAGFlow 的服务层提供了一套全面的数据库服务和业务逻辑处理程序,可在 HTTP API 层和底层存储系统之间进行协调。
核心服务组件

服务层遵循明确的关注点分离,每个服务负责特定的域逻辑和数据持

最低0.47元/天 解锁文章
3万+

被折叠的 条评论
为什么被折叠?



