AI智能体Manus 体验版

话说上周月会,老板明确给我一个身份定位, 必须熟知AI领域动态、原理,连续追问几个大模型问题后,贴脸开大。 我是谁,我从哪而来,我要去哪儿。我不只是个程序员,我是一位技术大咖,我是软硬件投资领域的大咖,我要做老板的眼睛、手臂。每日学一点,写一点,进一点。

1. 什么是Manus

Manus是2025年3月由中国武汉(创始人华中科技大学毕业)团队Monica.im推出的全球首款通用型AI智能体(AGI Agent),其核心理念为“手脑并用”(Mens et Manus),旨在通过自主规划与执行任务,将用户需求转化为实际成果,而非仅提供建议。
话说杭州、武汉,还有喊话的南京、抢人热火朝天的深圳。 科技站从中美的国与国之间,到国内一线二线城市之间,战火又烧到啦教育界,凡人紧紧抓住飞速移动的列车,一不小心就甩出去。

Manus标志着AI从“生成答案”到“交付成果”的跨越,其多智能体架构和工程化能力重新定义了人机协作模式。用户可通过官网申请内测(目前一个内测码已经炒到了8.8万),体验智能化闭环任务处理。

Manus(马努斯)是什么?Manus 是一个通用的人工智能代理,它连接思想和行动。它不仅会思考,还会提供结果。Manus 擅长处理工作和生活中的各种任务,可以在你休息时完成所有事情。

  • AGI Agent

**什么是AGI Agent(通用型AI智能体)?**AGI Agent并非单纯的“执行工具”或“对话系统”,而是将AGI的通用认知能力(如跨领域学习、抽象推理)与Agent的行动框架(规划、记忆、工具调用)深度融合的产物。

AGI与Agent融合形成AGI Agent,它既能像人类一样理解复杂需求,又能通过多模块协同将需求转化为具体成果,标志着AI从“辅助工具”向“生产力主体”的跃迁,其多智能体架构与工程化能力重新定义了人机协作模式
AGI Agent与传统Agent的差异是什么?AGI Agent旨在实现跨领域的通用智能,具备类似人类的广泛认知能力,能够自主理解抽象概念、迁移知识和主动设定目标;而传统Agent则专注于特定任务的执行,依赖预设规则或训练数据,其能力边界受限且无法处理未预定义的复杂问题。

  • 自主迭代能力:区别于传统Agent依赖人工调优,AGI Agent可通过交互持续优化算法(如Manus的“验证代理”模块通过交叉核验提升任务可靠性)。
  • 跨模态理解:整合文本、图像、代码等多模态数据,实现“手脑并用”式操作(如生成含地图的旅行手册并自动调整预算)。
  • 多智能体协同:采用“规划-执行-验证”架构,模拟人类团队分工(如分解股票分析任务为数据采集、建模、可视化子任务链)。
    **

传统Agent仅能处理预设规则内任务(如扫地机器人固定路径清扫),而AGI Agent可应对开放域问题(如医疗场景中综合患者数据生成诊断建议)。

2. 性能评估

GAIA是一个专注于评价AI助手解决现实世界能力的基准测试,本次Manus官方使用了pass@1即首次完成率作为评分标准。 从Manus AI官网给出的对比图片中可以看出,在Level 1基础任务方面,Manus以86.5%的准确率碾压OpenAI,证明其在常规场景如信息提取、简单计算下的可靠性。在Level 2复杂推理场景中,虽然没有与OpenAI拉开差距,但也以2.7个百分点小幅领先,体现其在多步骤任务中的稳定性。最后,在Level 3开放指令执行方面,取得了47.6%的突破性成绩,意味着Manus在处理模糊指令时能够更加接近人类水平。
在这里插入图片描述

3. 用法体验

Manus(马努斯)能干什么?Manus能处理复杂任务,提供完整成果,不仅限于建议。它记忆力强,服务器断连后可续任务,且学习能力强,能不断优化性能。
在Manus官网给出的众多用例中,我们选择了几个与各位分享,分别展示了Manus AI在日常生活、生产力还有交互性方面的强大能力。

  • 文档撰写与编辑:

Manus能够轻松撰写文章,包括新闻报道、商业文案等。用户只需提供简单的提示词,Manus就能生成结构完整、内容丰富的文档。它还能制作报告分析及PPT,整合信息并以直观的方式呈现给用户。

  • 编程与代码编写:

Manus具备编写代码的能力,可以完成从简单的脚本到复杂的软件开发的任务。它还能进行前端UI设计,为用户创建美观且功能强大的用户界面。

  • 数据分析与可视化:

Manus能够进行股票分析,提供过去几年的股票价格相关性分析,并编写用于数据分析和可视化的代码。它还能捕捉市场对特定公司的情绪变化,提供市场情绪分析报告。

  • 个性化旅行规划:

Manus能整合旅行信息,为用户创建定制旅行手册,提供个性化的旅行建议和详细行程安排。

3.1 给出一份四月日本旅行计划

首先prompt给出了游玩的需求:具体游玩的日期、时长和出发地点,出行预算以及期望的游玩内容;接着给出了期望得到的反馈形式:需要一个HTML制作的游玩手册,涵盖上面提到的所有内容以及旅行中需要的建议。 紧接着Manus就创建了一个Markdown文件用于记录所有的ToDo内容,并且开始一步步搜索相关内容,同时点进不同的网页查看相关内容:

image

image

在浏览过程中,它甚至会主动完成向下滚动页面、点击页面元素等操作:

image

阅读过程中,它也会尝试总结看到的内容,并且一步步完善ToDo表格,直到所有内容都如期完成:

image

image

最终,它按照要求给出了一个HTML版本的旅游手册,上面包含了所有需要的内容:

image

image

image

image

3.2 分析RL工程师应聘信息
Prompt直接提出了自己的需求:把这些候选人的信息整理成一份Excel,并且要根据个人能力对他们进行排名,并同时给出了一个.zip文件让Manus自己去分析。 在Manus的思考过程中我们可以看到,它直接对这个.zip文件进行解包,并且由于需要处理的是.pdf文件,Manus直接使用了python进行批量处理:

image

在分析完简历数量之后,Manus就开始尝试对简历的细节进行分析,在逐个编写候选人的analyze_resume_details.py后,经过多次重复操作,完成了对所有候选人的分析:

image

image

最终,Manus对每个人的能力进行了量化分析,给每个人赋予了RL Score作为他的能力的评价,并使用python工具创建了excel表格:

image

image

在Excel表格中,Manus把最适合的候选人用高亮进行标识,同时把每个人的个人项目经历、个人成就、RL能力分数以及评价都展示了出来,并在最后给出了自己对每个人的评价,极大简化了HR的工作流程。

image

image

4. 在本地安装和配置 Ollama 和 OpenManus 的指南

在这篇博客中,我们将一步步介绍如何在本地安装和配置 Ollama,以及如何使用 OpenManus 来快速启动一个 LLM(大型语言模型)应用程序。通过以下步骤,您将能够轻松地设置环境并开始使用这些工具。

4.1 安装 Ollama

首先,打开终端并运行以下命令来安装 Ollama:

curl -fsSL https://ollama.com/install.sh | sh

image

安装完成后,您可以检查 Ollama 服务的状态,以确保它已成功运行:

systemctl status ollama

4.2 修改配置

为了使 Ollama 能够满足我们的需求,我们需要进行一些配置修改。首先,安装 net-tools 工具,以便我们可以查看 Ollama 的网络状态:

sudo apt-get install net-tools
netstat -tunlp | grep ollama

接下来,您需要编辑 Ollama 的服务文件,以进行以下配置更改:

4.3 修改端口以允许外部访问

打开 Ollama 的服务文件:

vim /etc/systemd/system/ollama.service

[Service] 部分中,添加或修改以下行:

Environment="OLLAMA_HOST=0.0.0.0"

4.4 更改模型存放位置

同样在 ollama.service 文件中,指定模型的存储路径:

Environment="OLLAMA_MODELS=/workspace/ollama/models"

4.5 指定运行 GPU

如果您的系统中有多张 GPU,您可以通过设置 CUDA_VISIBLE_DEVICES 环境变量来指定要使用的 GPU:

Environment="CUDA_VISIBLE_DEVICES=0,1"

别忘了设置您的 API 密钥:

export OLLAMA_API_KEY="sk-11223344qwer"

4.6 重启 Ollama

完成所有配置后,您需要重启 Ollama 服务以应用更改:

systemctl daemon-reload
systemctl restart ollama

image

您可以通过以下命令运行 Ollama,并查看信息以确认端口已更改:

ollama run qwq

4.7 克隆 OpenManus 仓库

接下来,我们将安装 OpenManus。首先,克隆其 GitHub 仓库:

git clone https://github.com/mannaandpoem/OpenManus.git
cd OpenManus

然后安装所需的依赖项:

pip install -r requirements.txt

4.8 配置 OpenManus

OpenManus 需要配置 LLM API 的相关信息。请按照以下步骤设置配置文件:

config 目录中创建 config.toml 文件(可以从示例文件复制):
cp config/config.example.toml config/config.toml

编辑 config/config.toml 文件,添加您的 API 密钥并自定义设置:

# Global LLM configuration
[llm]
model = "qwq"
base_url = "http://localhost:11434/v1"
api_key = "sk-11223344qwer"
max_tokens = 4096
temperature = 0.0

# Optional configuration for specific LLM models
[llm.vision]
model = "claude-3-5-sonnet"
base_url = "https://api.openai.com/v1"
api_key = "sk-..."

4.9 快速启动 OpenManus

一切准备就绪后,您可以通过以下命令启动 OpenManus:

python main.py

然后,您可以通过终端输入您的想法,开始与 LLM 互动。

如果您想使用不稳定版本,您也可以运行:

python run_flow.py

image

5. 总结

我们不难发现,Manus确实可以一次性完成其他AI需要很多次提示才能完成的操作,并且直接实现想法是其他AI难以企及的。但是所有展示的用例中,Manus最多只能完成编写HTML或者执行python这样的操作,说明通用型AI智能体还有相当大的扩展空间,而且可预见的,这样的通用型AI智能体会对服务器性能提出相当大的挑战。我们这里也提供了 Ollama 版本的QWQ深度思考 和 OpenManus结合的样本。现在,您可以开始构建自己的 LLM 应用程序,探索更多的可能性!如果您在安装或配置过程中遇到问题,请随时在评论区留言,我们会尽快为您解答

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

赤胜骄阳

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值