为什么大型语言模型该抛弃“思维链”——改用工作流程才是未来

大型语言模型应弃思维链用工作流程

在这里插入图片描述

大型语言模型(LLMs)发展迅猛,而我们对它们的使用方式也正在发生变化。过去一种热门的训练和推理方法是 思维链(Chain of Thought, CoT) ——让模型“边想边说”,逐步展示推理过程。这在处理数学、逻辑问题时很有用,但在真实世界应用中,它的局限性开始显现。

本篇文章将阐述:为什么我们应该抛弃思维链,转向更加透明、灵活、可定制的方式 —— 工作流程(Workflow)


思维链的局限性

虽然思维链能让模型模拟人类推理,但它存在以下问题:

  • 不可见:推理链通常在训练时内嵌,用户无法查看或修改模型的思考路径。
  • 不可调:所有用户共享同一套固定逻辑,无法根据个人需求进行定制。
  • 不稳定:稍微改变问题的表述就可能导致推理链断裂,结果不一致。

这使得思维链在研究中有用,但在现实应用中难以控制和复用。


工作流程,更透明也更可控

与其让模型“在脑海中”默默思考,不如将推理过程拆解为 可视化的工作流程

工作流程的优势:

  • 可观察:每个步骤清晰可见。
  • 可定制:可以插入工具、修改逻辑、加入人工评审等操作。
  • 可复用:不同用户可以使用不同模板,构建属于自己的流程。

工作流程让 AI 不再是黑盒,而是可以参与协作的助手。


同一问题,不同用户,不同流程

工作流程允许不同角色对同一问题制定各自的解法:

问题:请总结这份法律文档。

  • 律师 可能需要:

    • 法律引用
    • 判例分析
    • 风险提示
  • 记者 更关注:

    • 通俗表达
    • 标题提炼
    • 公众价值
  • 学生 更希望看到:

    • 要点列出
    • 简明术语
    • 问答格式

而思维链无法区分这些需求,只能给出一种通用推理路径。


用户私有数据与检索增强:RAG 的优势

工作流程还能接入 用户专属知识库,实现 RAG(检索增强生成):

  • 思维链无法实现数据检索的定制与插拔
  • 而工作流程可以集成:
    • 个人笔记
    • 企业文档
    • 多数据源组合
    • 安全过滤与权限控制

AI 将不再只依赖通用训练语料,而是根植于你的世界。


实例:从数学家教到法律助手

思维链模型可能会说:“第一步……第二步……”,但无法让用户修改这些步骤。

而工作流程可以清楚列出:

  1. 解析问题
  2. 选择公式
  3. 代入数据
  4. 计算结果

你可以替换步骤、加入插件、调换顺序,一切尽在掌控。


个性化推理 = 更聪明的 AI

工作流程让 AI 适应人,而不是人迁就 AI。你可以:

  • 设计自己的逻辑模块
  • 调用自选工具
  • 动态控制流程
  • 接入专属数据
  • 重复使用经过优化的流程块

AI 成为一个真正与你共创的协作伙伴。


Pathway 与 Prompits:工作流程的智能进化

在开源 AI 框架 Prompits 中,工作流程被结构化为 Pathway(流程图谱)

Pathway 是由多个步骤(称为 Post)组成的逻辑流程,每个步骤可以执行:

  • 模型调用
  • 数据检索
  • 工具操作
  • 条件判断
  • 与其他 智能体 协作

Pathway 的特性包括:

  • AI 自动生成:用户只需输入目标,系统即可生成对应流程;
  • 持续优化:根据使用反馈进行演化升级;
  • 可复用共享:优质流程可复制、组合、跨项目使用;
  • 模块化与可审计:每一步均可查看、测试与替换。

结合 Prompits 的核心元素:

  • Pit(智能体):自主服务单元
  • Pool(数据池):可访问的数据资源
  • Plaza(发现与协作空间):智能体发布信息,互相识别连接

你可以构建出一整套 面向个体目标与数据 的智能系统。


结语:思维链,是时候退出历史舞台了

思维链为 LLM 打开了推理之门,但真正具备适应性、可组合性与可持续性的 AI,应当建立在 可视化、可共享的工作流程 上。

未来的 AI,不是拥有固定思维方式的助手,而是可以与你共同演化的伙伴。

欢迎访问 Prompits.ai,探索工作流程驱动的智能系统,打造属于你的 AI。


如果你的模型是基于子类化(Inheritance)的方式设计的,通常是因为你需要更灵活、定制化的控制模型的行为。在这种情况下,为了便于保存和复用,将模型转换为Keras的`Functional`或`Sequential`架构是一个可行的选择: 1. **Sequential模型**:适用于较简单的线性模型或序列处理,它的结构类似于一个列表,每一层依次连接。将子类化模型拆分成多个独立的层,并按照顺序排列到`Sequential`实例中,可以方便地保存和调用。 ```python from tensorflow import keras # 示例: inputs = keras.Input(shape=(input_shape,)) x = ... # 这里是你子类化模型的各个层操作 output = ... # 最后的输出层 functional_model = keras.Model(inputs=inputs, outputs=output) functional_model.save('my_functional_model.h5') ``` 2. **Functional API**:提供了一种更为灵活的方式来构建复杂的网络结构,它允许你在任何时候添加、删除或改变层之间的连接。同样,你可以将子类化模型的组成部分提取出来并组织成一个函数式模型。 ```python from tensorflow.keras.layers import Input, Dense # 示例: def create_subclassed_model(): x = ... # 子类化模型内部的输入和层操作 return x inputs = Input(shape=input_shape) outputs = create_subclassed_model()(inputs) functional_model = keras.Model(inputs=inputs, outputs=outputs) functional_model.save('my_functional_api_model.h5') ``` 这样做的好处是可以保留你的代码逻辑,同时利用Keras提供的标准模型保存功能。但是要注意的是,转换过程中可能需要一些重构工作以适应新的API风格。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值