Dify 工作流--技术分析文档

原创于 2025-12-15 09:00:00 发布 · 418 阅读

12 ·

CC 4.0 BY-SA版权

文章标签：

#workflow #Dify #大模型 #工作流

Dify那些事儿专栏收录该内容

7 篇文章

订阅专栏

概述

Dify工作流管理系统是一个基于队列的分布式工作流执行引擎，支持可视化AI工作流的构建、调试和执行。本文档详细分析了工作流管理的核心场景和涉及的技术组件。

架构总览

┌─────────────────────────────────────────────────────────────────┐
│                         前端层 (Frontend)                        │
│  React 19 + Next.js 15 + Zustand + React Flow                  │
└─────────────────────────────────────────────────────────────────┘
                              │ HTTP/SSE
                              ▼
┌─────────────────────────────────────────────────────────────────┐
│                         API层 (Controllers)                      │
│  Flask-RESTX + JWT认证 + 参数解析                                │
└─────────────────────────────────────────────────────────────────┘
                              │
                              ▼
┌─────────────────────────────────────────────────────────────────┐
│                         服务层 (Services)                        │
│  WorkflowService + AppGenerateService                           │
└─────────────────────────────────────────────────────────────────┘
                              │
                              ▼
┌─────────────────────────────────────────────────────────────────┐
│                      工作流引擎层 (Core)                         │
│  WorkflowEntry → GraphEngine → Nodes                            │
└─────────────────────────────────────────────────────────────────┘
                              │
                              ▼
┌─────────────────────────────────────────────────────────────────┐
│                         数据层 (Storage)                         │
│  PostgreSQL (持久化) + Redis (缓存/消息)                         │
└─────────────────────────────────────────────────────────────────┘

工作流管理流程图

在这里插入图片描述

核心场景分析

1. 工作流创建/编辑阶段

涉及组件

组件	位置	职责
`DraftWorkflowApi`	`api/controllers/console/app/workflow.py`	草稿工作流API端点
`WorkflowService`	`api/services/workflow_service.py`	工作流业务逻辑
`hooks-store`	`web/app/components/workflow/hooks-store/`	前端状态管理

核心流程

# 后端处理流程
1. DraftWorkflowApi.post() 接收请求
   - 解析 graph, features, environment_variables, conversation_variables
   - 验证请求参数

2. WorkflowService.sync_draft_workflow()
   - 验证 unique_hash 防止并发冲突
   - validate_features_structure() 验证特性配置
   - 创建或更新 Workflow 记录
   - 触发 app_draft_workflow_was_synced 事件

关键数据结构

# Workflow 模型核心字段
class Workflow:
    id: str                    # 工作流ID
    tenant_id: str             # 租户ID
    app_id: str                # 应用ID
    type: WorkflowType         # workflow | chat
    version: str               # draft | 时间戳版本
    graph: str                 # JSON格式的图配置
    features: str              # JSON格式的特性配置
    environment_variables: list  # 环境变量
    conversation_variables: list # 会话变量

2. 工作流执行阶段

涉及组件

组件	位置	职责
`WorkflowEntry`	`api/core/workflow/workflow_entry.py`	工作流执行入口
`GraphEngine`	`api/core/workflow/graph_engine/graph_engine.py`	图执行引擎核心
`Dispatcher`	`api/core/workflow/graph_engine/orchestration/`	事件调度器
`WorkerPool`	`api/core/workflow/graph_engine/worker_management/`	工作线程池
`EventManager`	`api/core/workflow/graph_engine/event_management/`	事件管理器

执行流程详解

# 1. 入口初始化
WorkflowEntry.__init__(
    tenant_id, app_id, workflow_id,
    graph_config, graph, variable_pool,
    command_channel  # 用于外部控制
)
    → 检查 call_depth 限制
    → 创建 GraphEngine 实例
    → 添加 DebugLoggingLayer (调试模式)
    → 添加 ExecutionLimitsLayer (执行限制)

# 2. GraphEngine 初始化
GraphEngine.__init__(workflow_id, graph, graph_runtime_state, command_channel)
    → GraphStateManager: 节点状态管理
    → ReadyQueue: 就绪节点队列
    → EventManager: 事件收集和发射
    → EdgeProcessor: 边处理和条件分支
    → SkipPropagator: 跳过状态传播
    → CommandProcessor: 外部命令处理
    → WorkerPool: 并行执行工作池

# 3. 执行循环
GraphEngine.run()
    → _initialize_layers()
    → _start_execution()
        → WorkerPool.start()
        → 注册响应节点
        → 入队根节点
        → Dispatcher.start()
    → 事件生成和发射循环
    → 完成处理 (Succeeded/PartialSucceeded/Failed/Aborted)
    → _stop_execution()

事件流转

GraphRunStartedEvent
    ↓
NodeRunStartedEvent → NodeRunSucceededEvent/NodeRunFailedEvent
    ↓ (循环)
NodeRunStreamChunkEvent (流式输出)
NodeRunRetrieverResourceEvent (检索资源)
NodeRunAgentLogEvent (智能体日志)
    ↓
GraphRunSucceededEvent / GraphRunFailedEvent / GraphRunAbortedEvent

3. 节点执行机制

节点类型映射

# api/core/workflow/nodes/node_mapping.py
NODE_TYPE_CLASSES_MAPPING = {
    NodeType.START: {"1": StartNode},
    NodeType.END: {"1": EndNode},
    NodeType.ANSWER: {"1": AnswerNode},
    NodeType.LLM: {"1": LLMNode},
    NodeType.AGENT: {"1": AgentNode},
    NodeType.CODE: {"1": CodeNode},
    NodeType.IF_ELSE: {"1": IfElseNode},
    NodeType.ITERATION: {"1": IterationNode},
    NodeType.LOOP: {"1": LoopNode},
    NodeType.TOOL: {"1": ToolNode},
    NodeType.KNOWLEDGE_RETRIEVAL: {"1": KnowledgeRetrievalNode},
    NodeType.PARAMETER_EXTRACTOR: {"1": ParameterExtractorNode},
    NodeType.QUESTION_CLASSIFIER: {"1": QuestionClassifierNode},
    NodeType.HTTP_REQUEST: {"1": HttpRequestNode},
    NodeType.TEMPLATE_TRANSFORM: {"1": TemplateTransformNode},
    NodeType.VARIABLE_AGGREGATOR: {"1": VariableAggregatorNode},
    NodeType.VARIABLE_ASSIGNER: {"1": VariableAssignerNodeV1, "2": VariableAssignerNodeV2},
    NodeType.DOCUMENT_EXTRACTOR: {"1": DocumentExtractorNode},
    NodeType.LIST_OPERATOR: {"1": ListOperatorNode},
}

节点执行生命周期

class Node:
    def run(self) -> Generator[NodeEvent, None, None]:
        """节点执行入口"""
        # 1. 前置处理
        yield NodeRunStartedEvent(...)
        
        # 2. 执行业务逻辑
        result = self._run()
        
        # 3. 后置处理
        if result.status == NodeExecutionStatus.SUCCEEDED:
            yield NodeRunSucceededEvent(...)
        else:
            yield NodeRunFailedEvent(...)

4. 错误处理策略

# api/core/workflow/nodes/enums.py
class ErrorStrategy(Enum):
    FAIL_BRANCH = "fail-branch"  # 走失败分支
    CONTINUE = "continue"         # 继续执行
    STOP = "stop"                 # 停止执行

5. 外部控制机制

命令通道

# 命令类型
class AbortCommand(GraphEngineCommand):
    """停止工作流执行"""
    reason: str

class PauseCommand(GraphEngineCommand):
    """暂停工作流执行"""
    reason: str

# 通道实现
- InMemoryChannel: 进程内通信，适用于单实例
- RedisChannel: Redis发布订阅，适用于分布式部署

管理器API

# api/core/workflow/graph_engine/manager.py
class GraphEngineManager:
    @staticmethod
    def send_stop_command(task_id: str, reason: str = None):
        """发送停止命令"""
        channel_key = f"workflow:{task_id}:commands"
        channel = RedisChannel(redis_client, channel_key)
        channel.send_command(AbortCommand(reason=reason))
    
    @staticmethod
    def send_pause_command(task_id: str, reason: str = None):
        """发送暂停命令"""
        # 类似实现

6. 变量池管理

# api/core/workflow/runtime/variable_pool.py
class VariablePool:
    """
    集中式变量存储，命名空间隔离
    """
    system_variables: SystemVariable      # 系统变量
    user_inputs: dict                      # 用户输入
    environment_variables: list[Variable]  # 环境变量
    
    def add(self, selector: list[str], value: Any):
        """添加变量，按node_id隔离"""
        # pool.add(["node1", "output"], value)
    
    def get(self, selector: list[str]) -> VariableValue:
        """获取变量"""
        # pool.get(["node1", "output"])

前端架构

状态管理

// web/app/components/workflow/hooks-store/store.ts
interface HooksStore {
  // 工作流操作
  handleBackupDraft: () => void
  handleLoadBackupDraft: () => void
  handleRestoreFromPublishedWorkflow: () => void
  handleRun: (params, callback?) => void
  handleStopRun: () => void
  handleStartWorkflowRun: () => void
  
  // 工作流模式
  handleWorkflowStartRunInWorkflow: () => void
  handleWorkflowStartRunInChatflow: () => void
}

工作流状态

// web/app/components/workflow/store/workflow/workflow-slice.ts
interface WorkflowSliceShape {
  workflowRunningData?: PreviewRunningData  // 运行状态
  clipboardElements: Node[]                  // 剪贴板
  selection: SelectionRect | null            // 选择区域
  controlMode: 'pointer' | 'hand'            // 操作模式
  showImportDSLModal: boolean                // DSL导入
  workflowConfig?: Record<string, any>       // 配置
}

Layer扩展系统

GraphEngine支持可插拔的Layer系统，用于扩展功能：

# 内置Layers
class DebugLoggingLayer(GraphEngineLayer):
    """调试日志层"""
    def on_event(self, event: GraphEngineEvent):
        logger.debug(f"Event: {event}")

class ExecutionLimitsLayer(GraphEngineLayer):
    """执行限制层"""
    def __init__(self, max_steps: int, max_time: float):
        self.max_steps = max_steps
        self.max_time = max_time

# 使用方式
engine = GraphEngine(...)
engine.layer(DebugLoggingLayer(level="DEBUG"))
engine.layer(ExecutionLimitsLayer(max_steps=100, max_time=600))

配置参数

工作流限制

# configs/dify_config.py
WORKFLOW_CALL_MAX_DEPTH = 5           # 最大调用深度
WORKFLOW_MAX_EXECUTION_STEPS = 500    # 最大执行步数
WORKFLOW_MAX_EXECUTION_TIME = 1200    # 最大执行时间(秒)

WorkerPool配置

# GraphEngine初始化参数
min_workers: int        # 最小工作线程数
max_workers: int        # 最大工作线程数
scale_up_threshold: int # 扩容阈值
scale_down_idle_time: float  # 缩容空闲时间

数据库模型

Workflow表

字段	类型	说明
id	UUID	主键
tenant_id	UUID	租户ID
app_id	UUID	应用ID
type	String	workflow/chat
version	String	draft或时间戳
graph	Text	图配置JSON
features	Text	特性配置JSON
created_by	UUID	创建者
created_at	DateTime	创建时间
updated_at	DateTime	更新时间

WorkflowRun表

字段	类型	说明
id	UUID	主键
workflow_id	UUID	工作流ID
status	String	running/succeeded/failed/stopped
inputs	Text	输入JSON
outputs	Text	输出JSON
total_tokens	Integer	Token消耗
total_steps	Integer	执行步数
elapsed_time	Float	执行时间
error	Text	错误信息

WorkflowNodeExecution表

字段	类型	说明
id	UUID	主键
workflow_run_id	UUID	运行ID
node_id	String	节点ID
node_type	String	节点类型
status	String	执行状态
inputs	Text	输入JSON
outputs	Text	输出JSON
process_data	Text	处理数据
error	Text	错误信息