Manus:把AI真正当人对待

图片

摘要

2025年末,Meta公司以超过20亿美元的价格收购华人背景的AI初创公司Manus,这一事件不仅是资本市场的又一次巨额并购,更是计算历史上一个决定性的分水岭。它标志着“软件即服务”(SaaS)时代的终结,与“服务即软件”(Service as a Software, SaaSw)时代的黎明。数十年来,软件工程的主流哲学建立在决定论的基础之上:输入必须产生可预测的、同一的输出,可靠性被定义为错误的缺席。然而,Manus通过一种激进的产品哲学打破了这一正统:它接纳大语言模型(LLM)固有的“不稳定性”,并通过将其包裹在一个自修正、递归的架构中,将这种不稳定性转化为一种类人的“概率性自主”。

本文旨在对Manus的产品哲学进行穷尽式的剖析,论证其如何通过接纳“不完美”重构了人与软件的关系。我们将深入探讨Manus如何通过“Planner(规划者)- Executor(执行者)- Critic(批评者)”的认知架构,将生成式AI的幻觉转化为创造性的探索;分析“Manus’s Computer(Manus的电脑)”这一独特的拟人化界面如何利用“过程暴露效应”建立人机信任;并从政治经济学角度推演“代理模式”的崩溃与“数字劳动”的崛起。最终,通过Meta的战略收购,我们得以窥见一个新时代的雏形:在这个时代,软件不再是被动的工具,而是持有行动契约的数字劳工。


第一部分:不完美的哲学——从决定论工具到概率性代理

1.1 决定论的黄昏与软件1.0的危机

要理解Manus的革命性,我们必须首先审视支配计算机科学半个世纪的教条——决定论。在被称为“软件1.0”的传统范式中,代码是逻辑的刚性固化:如果 X,则 Y。这种哲学的核心价值在于其绝对的可预测性。一个电子表格如果计算出 2 + 2 = 4.0001,它不是在发挥“创造力”,而是发生了故障。在这一体系下,可靠性是二元的:程序要么完美运行,要么彻底崩溃。这种对确定性的追求创造了一个“完美信息与完美知识的世界”,工程师的工作即是规划一切可能的状态,任何未被捕获的异常都被视为必须根除的Bug。

这种决定论哲学在处理银行转账、物理模拟或数据库管理等精确任务时表现卓越,因为它将混乱的现实世界抽象为整齐的数据结构。然而,当软件试图介入人类意图的模糊地带——那些充满歧义、非结构化和创造性的知识工作时,决定论撞上了坚硬的天花板。人类的语言是不精确的,人类的需求是流动的,人类的工作环境(如互联网)是充满噪音的。试图用刚性的逻辑去捕捉流动的意图,导致了传统自动化工具的僵化与脆弱。

大语言模型(LLM)的出现催生了“软件2.0”。在这个新范式中,逻辑不再由人类显式编写,而是由神经网络从海量数据中隐式习得;输出不再是确定的,而是概率的。这种转变最初引发了一场效用危机:企业如何能信任一个可能会捏造法律条文或算错财务报表的系统?早期的AI“副驾驶”(Copilot)试图将这些概率模型强行塞入决定论的框架中,将它们视为仅仅是文本生成器,需要人类时刻保持在回路中(Human-in-the-loop)进行监督。这种模式虽然在一定程度上利用了AI的能力,但本质上并未改变人与工具的主从关系,甚至因为需要时刻警惕AI的错误,反而增加了人类的认知负荷,变成了一种“保姆式”的交互。

1.2 Manus的本体论突围:将“不稳定性”作为一种特性

Manus的产品哲学之所以激进,在于它没有试图掩盖或消除底层模型的“不稳定性”,而是将其视为智能系统的一种根本属性加以接纳和利用。其核心论点是:真正的自主性(Autonomy)必然包含失败的自由和恢复的能力。

在传统的软件环境中,错误(例如爬虫遇到“404 Not Found”)通常会导致程序终止或抛出异常报告,随后必须由人类介入,修正URL或调整参数。这种系统的脆弱性在于它没有“关于错误的模型”。而在Manus的哲学中,错误被重新定义为一种新信息。如果一个链接失效,或者一段代码报错,这并不是流程的终点,而是决策树的一个分支点。代理(Agent)并不因此崩溃,而是像人类研究员一样,“决定”寻找替代信源或修改查询策略。

这构成了Manus哲学的基石——“概率性韧性”(Probabilistic Resilience)。Manus在一个递归的“观察-决策-行动”(Observe-Decide-Act)循环中运行。它将一个高层级的、模糊的目标(例如“制定一个爱丁堡旅行计划”或“分析特斯拉的股票”)分解为一系列原子化的步骤。关键在于,它引入了一个二阶控制论机制——“验证者”或“批评者”(Critic)代理,用于监控“执行者”(Executor)代理的输出。如果输出未达标(例如股票数据过时),系统会自我修正,重新进入循环,而不是等待人类指令。

这种架构将可靠性的定义从“从不犯错”转变为“总能完成”。它承认,在追求复杂、开放式任务的过程中,通往解决方案的路径极少是一条直线。Manus建立的是一个“反脆弱”(Antifragile)系统,它通过迭代尝试来提高成功的概率,从而弥合了现实数据的混乱性与用户对确定性结果的需求之间的鸿沟。这种对不完美的包容,使得软件第一次拥有了类似生物的适应性。

1.3 认知架构的解剖:规划、执行与自我批判

Manus并非单一的模型,而是一个管理着“思维社会”(Society of Minds)的编排层。其实现这一哲学的技术手段,是建立一个模仿人类认知过程的多代理分层架构。这一架构的精妙之处在于它将“思考”与“行动”解耦,又将“行动”与“反思”解耦。

1. 规划者(Planner):模糊意图的结构化

处于顶层的是规划者代理。它的职责不是执行任务,而是理解意图。当用户输入一个模糊指令时,规划者利用大模型的推理能力,将其转化为一个有向无环图(DAG)或依赖关系树。例如,面对“做一份竞品分析”的任务,规划者会将其拆解为“识别竞争对手”、“抓取定价页面”、“分析功能列表”、“生成SWOT图表”等子任务,并确定执行顺序。这一过程实际上是在用概率性的推理去填补用户指令中的逻辑空白。

2. 执行者(Executor):基于工具的具身行动

执行者是系统的“手”。Manus集成了超过29种工具和开源模块,其中最核心的是“Browser Use”库。通过这个库,执行者代理获得了“数字视觉”和“数字触觉”。它不是通过API(往往是受限的)去访问网络,而是像人一样通过浏览器界面(GUI)去交互——点击按钮、填写表单、滚动页面。这种设计选择本身就体现了对现实世界“不完美”的适应:API是理想化的接口,而网页是给人看的、充满噪音的界面。执行者利用视觉模型(Vision Models)来理解网页布局,从而在面对UI变化时表现出极强的鲁棒性。

3. 批评者(Critic/Debugger):内化的监督回路

这是Manus最核心的创新所在。在传统的软件开发中,Debug(调试)是程序员的工作。而在Manus中,Debug被内化为软件自身的功能。当执行者编写的Python脚本抛出语法错误,或者抓取的数据为空时,批评者代理会介入。它读取错误日志(Traceback),分析失败原因(例如“缺少库”或“选择器失效”),并生成修正指令发送回执行者。

这种“自

数据集介绍:垃圾分类检测数据集 一、基础信息 数据集名称:垃圾分类检测数据集 图片数量: 训练集:2,817张图片 验证集:621张图片 测试集:317张图片 总计:3,755张图片 分类类别: - 金属:常见的金属垃圾材料。 - 纸板:纸板类垃圾,如包装盒等。 - 塑料:塑料类垃圾,如瓶子、容器等。 标注格式: YOLO格式,包含边界框和类别标签,适用于目标检测任务。 数据格式:图片来源于实际场景,格式为常见图像格式(如JPEG/PNG)。 二、适用场景 智能垃圾回收系统开发: 数据集支持目标检测任务,帮助构建能够自动识别和分类垃圾材料的AI模型,用于自动化废物分类和回收系统。 环境监测与废物管理: 集成至监控系统或机器中,实时检测垃圾并分类,提升废物处理效率和环保水平。 学术研究与教育: 支持计算机视觉与环保领域的交叉研究,用于教学、实验和论文发表。 三、数据集优势 类别覆盖全面: 包含三种常见垃圾材料类别,覆盖日常生活中主要的可回收物类型,具有实际应用价值。 标注精准可靠: 采用YOLO标注格式,边界框定位精确,类别标签准确,便于模型直接训练和使用。 数据量适中合理: 训练集、验证集和测试集分布均衡,提供足够样本用于模型学习和评估。 任务适配性强: 标注兼容主流深度学习框架(如YOLO等),可直接用于目标检测任务,支持垃圾检测相关应用。
在实现得物网站爬虫时,要遵循得物平台的使用政策,确保数据合规,同时采用合适的技术规避反爬虫机制。 实现方法上,可使用`requests`库发送HTTP请求获取网页HTML内容。以闲鱼搜索页为例,代码如下: ```python import requests from bs4 import BeautifulSoup # 假设的得物商品页URL,需替换为实际链接 url = "https://example.dewu.com/item.htm?id=xxxxx" # 模拟浏览器请求头,避免被反爬虫拦截 headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36" } # 发送请求 response = requests.get(url, headers=headers) response.encoding = 'utf-8' # 解析HTML内容 soup = BeautifulSoup(response.text, 'html.parser') # 打印网页内容(可根据需要调整) print(soup.prettify()) ``` 也可将网页源内容爬取到本地,避免短时间多次请求被封IP,示例代码如下: ```python import requests headers = { 'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7', 'accept-language': 'zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6', 'cache-control': 'no-cache', 'pragma': 'no-cache', 'priority': 'u=0, i', 'referer': 'https://cn.bing.com/', 'upgrade-insecure-requests': '1', 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/139.0.0.0 Safari/537.36 Edg/139.0.0.0', } response = requests.get('https://www.dewu.com/siteindex', headers=headers) # 将siteindex网页html爬取下来,并保存到本地txt,方便后续正则或beautifulsoup提取链接 with open('test.txt', 'w', encoding='utf-8') as f: f.write(response.text) ``` 技术要点方面,数据合规是重要前提,系统设计需严格遵循得物平台的使用政策,采集的数据应为公开可获取的商品信息,不涉及用户隐私数据。为规避反爬虫机制,机器可内置智能节流机制,自动调节访问频率,模拟类操作模式,如随机滑动、间隔停顿等 [^1]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值