Manus：把AI真正当人对待

原创

于 2026-01-06 10:48:12 发布 · 736 阅读

19 ·

CC 4.0 BY-SA版权

文章标签：

#agent #语言模型

摘要

2025年末，Meta公司以超过20亿美元的价格收购华人背景的AI初创公司Manus，这一事件不仅是资本市场的又一次巨额并购，更是计算历史上一个决定性的分水岭。它标志着“软件即服务”（SaaS）时代的终结，与“服务即软件”（Service as a Software, SaaSw）时代的黎明。数十年来，软件工程的主流哲学建立在决定论的基础之上：输入必须产生可预测的、同一的输出，可靠性被定义为错误的缺席。然而，Manus通过一种激进的产品哲学打破了这一正统：它接纳大语言模型（LLM）固有的“不稳定性”，并通过将其包裹在一个自修正、递归的架构中，将这种不稳定性转化为一种类人的“概率性自主”。

本文旨在对Manus的产品哲学进行穷尽式的剖析，论证其如何通过接纳“不完美”重构了人与软件的关系。我们将深入探讨Manus如何通过“Planner（规划者）- Executor（执行者）- Critic（批评者）”的认知架构，将生成式AI的幻觉转化为创造性的探索；分析“Manus’s Computer（Manus的电脑）”这一独特的拟人化界面如何利用“过程暴露效应”建立人机信任；并从政治经济学角度推演“代理模式”的崩溃与“数字劳动”的崛起。最终，通过Meta的战略收购，我们得以窥见一个新时代的雏形：在这个时代，软件不再是被动的工具，而是持有行动契约的数字劳工。

第一部分：不完美的哲学——从决定论工具到概率性代理

1.1 决定论的黄昏与软件1.0的危机

要理解Manus的革命性，我们必须首先审视支配计算机科学半个世纪的教条——决定论。在被称为“软件1.0”的传统范式中，代码是逻辑的刚性固化：如果 X，则 Y。这种哲学的核心价值在于其绝对的可预测性。一个电子表格如果计算出 2 + 2 = 4.0001，它不是在发挥“创造力”，而是发生了故障。在这一体系下，可靠性是二元的：程序要么完美运行，要么彻底崩溃。这种对确定性的追求创造了一个“完美信息与完美知识的世界”，工程师的工作即是规划一切可能的状态，任何未被捕获的异常都被视为必须根除的Bug。

这种决定论哲学在处理银行转账、物理模拟或数据库管理等精确任务时表现卓越，因为它将混乱的现实世界抽象为整齐的数据结构。然而，当软件试图介入人类意图的模糊地带——那些充满歧义、非结构化和创造性的知识工作时，决定论撞上了坚硬的天花板。人类的语言是不精确的，人类的需求是流动的，人类的工作环境（如互联网）是充满噪音的。试图用刚性的逻辑去捕捉流动的意图，导致了传统自动化工具的僵化与脆弱。

大语言模型（LLM）的出现催生了“软件2.0”。在这个新范式中，逻辑不再由人类显式编写，而是由神经网络从海量数据中隐式习得；输出不再是确定的，而是概率的。这种转变最初引发了一场效用危机：企业如何能信任一个可能会捏造法律条文或算错财务报表的系统？早期的AI“副驾驶”（Copilot）试图将这些概率模型强行塞入决定论的框架中，将它们视为仅仅是文本生成器，需要人类时刻保持在回路中（Human-in-the-loop）进行监督。这种模式虽然在一定程度上利用了AI的能力，但本质上并未改变人与工具的主从关系，甚至因为需要时刻警惕AI的错误，反而增加了人类的认知负荷，变成了一种“保姆式”的交互。

1.2 Manus的本体论突围：将“不稳定性”作为一种特性

Manus的产品哲学之所以激进，在于它没有试图掩盖或消除底层模型的“不稳定性”，而是将其视为智能系统的一种根本属性加以接纳和利用。其核心论点是：真正的自主性（Autonomy）必然包含失败的自由和恢复的能力。

在传统的软件环境中，错误（例如爬虫遇到“404 Not Found”）通常会导致程序终止或抛出异常报告，随后必须由人类介入，修正URL或调整参数。这种系统的脆弱性在于它没有“关于错误的模型”。而在Manus的哲学中，错误被重新定义为一种新信息。如果一个链接失效，或者一段代码报错，这并不是流程的终点，而是决策树的一个分支点。代理（Agent）并不因此崩溃，而是像人类研究员一样，“决定”寻找替代信源或修改查询策略。

这构成了Manus哲学的基石——“概率性韧性”（Probabilistic Resilience）。Manus在一个递归的“观察-决策-行动”（Observe-Decide-Act）循环中运行。它将一个高层级的、模糊的目标（例如“制定一个爱丁堡旅行计划”或“分析特斯拉的股票”）分解为一系列原子化的步骤。关键在于，它引入了一个二阶控制论机制——“验证者”或“批评者”（Critic）代理，用于监控“执行者”（Executor）代理的输出。如果输出未达标（例如股票数据过时），系统会自我修正，重新进入循环，而不是等待人类指令。

这种架构将可靠性的定义从“从不犯错”转变为“总能完成”。它承认，在追求复杂、开放式任务的过程中，通往解决方案的路径极少是一条直线。Manus建立的是一个“反脆弱”（Antifragile）系统，它通过迭代尝试来提高成功的概率，从而弥合了现实数据的混乱性与用户对确定性结果的需求之间的鸿沟。这种对不完美的包容，使得软件第一次拥有了类似生物的适应性。

1.3 认知架构的解剖：规划、执行与自我批判

Manus并非单一的模型，而是一个管理着“思维社会”（Society of Minds）的编排层。其实现这一哲学的技术手段，是建立一个模仿人类认知过程的多代理分层架构。这一架构的精妙之处在于它将“思考”与“行动”解耦，又将“行动”与“反思”解耦。

1. 规划者（Planner）：模糊意图的结构化

处于顶层的是规划者代理。它的职责不是执行任务，而是理解意图。当用户输入一个模糊指令时，规划者利用大模型的推理能力，将其转化为一个有向无环图（DAG）或依赖关系树。例如，面对“做一份竞品分析”的任务，规划者会将其拆解为“识别竞争对手”、“抓取定价页面”、“分析功能列表”、“生成SWOT图表”等子任务，并确定执行顺序。这一过程实际上是在用概率性的推理去填补用户指令中的逻辑空白。

2. 执行者（Executor）：基于工具的具身行动

执行者是系统的“手”。Manus集成了超过29种工具和开源模块，其中最核心的是“Browser Use”库。通过这个库，执行者代理获得了“数字视觉”和“数字触觉”。它不是通过API（往往是受限的）去访问网络，而是像人一样通过浏览器界面（GUI）去交互——点击按钮、填写表单、滚动页面。这种设计选择本身就体现了对现实世界“不完美”的适应：API是理想化的接口，而网页是给人看的、充满噪音的界面。执行者利用视觉模型（Vision Models）来理解网页布局，从而在面对UI变化时表现出极强的鲁棒性。

3. 批评者（Critic/Debugger）：内化的监督回路

这是Manus最核心的创新所在。在传统的软件开发中，Debug（调试）是程序员的工作。而在Manus中，Debug被内化为软件自身的功能。当执行者编写的Python脚本抛出语法错误，或者抓取的数据为空时，批评者代理会介入。它读取错误日志（Traceback），分析失败原因（例如“缺少库”或“选择器失效”），并生成修正指令发送回执行者。

这种“自