AI智能体Manus 体验版

最新推荐文章于 2025-03-30 07:24:36 发布

原创最新推荐文章于 2025-03-30 07:24:36 发布 · 1.2k 阅读

24 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #manus

大模型知识库专栏收录该内容

26 篇文章

订阅专栏

AI智能体Manus 体验版

1. 什么是Manus
2. 性能评估
3. 用法体验
- 3.1 给出一份四月日本旅行计划
4. 在本地安装和配置 Ollama 和 OpenManus 的指南
5. 总结

话说上周月会，老板明确给我一个身份定位，必须熟知AI领域动态、原理，连续追问几个大模型问题后，贴脸开大。我是谁，我从哪而来，我要去哪儿。我不只是个程序员，我是一位技术大咖，我是软硬件投资领域的大咖，我要做老板的眼睛、手臂。每日学一点，写一点，进一点。

1. 什么是Manus

Manus是2025年3月由中国武汉（创始人华中科技大学毕业）团队Monica.im推出的全球首款通用型AI智能体（AGI Agent），其核心理念为“手脑并用”（Mens et Manus），旨在通过自主规划与执行任务，将用户需求转化为实际成果，而非仅提供建议。
话说杭州、武汉，还有喊话的南京、抢人热火朝天的深圳。科技站从中美的国与国之间，到国内一线二线城市之间，战火又烧到啦教育界，凡人紧紧抓住飞速移动的列车，一不小心就甩出去。

Manus标志着AI从“生成答案”到“交付成果”的跨越，其多智能体架构和工程化能力重新定义了人机协作模式。用户可通过官网申请内测（目前一个内测码已经炒到了8.8万），体验智能化闭环任务处理。

Manus（马努斯）是什么？Manus 是一个通用的人工智能代理，它连接思想和行动。它不仅会思考，还会提供结果。Manus 擅长处理工作和生活中的各种任务，可以在你休息时完成所有事情。

AGI Agent

**什么是AGI Agent（通用型AI智能体）？**AGI Agent并非单纯的“执行工具”或“对话系统”，而是将AGI的通用认知能力（如跨领域学习、抽象推理）与Agent的行动框架（规划、记忆、工具调用）深度融合的产物。

AGI与Agent融合形成AGI Agent，它既能像人类一样理解复杂需求，又能通过多模块协同将需求转化为具体成果，标志着AI从“辅助工具”向“生产力主体”的跃迁，其多智能体架构与工程化能力重新定义了人机协作模式
AGI Agent与传统Agent的差异是什么？AGI Agent旨在实现跨领域的通用智能，具备类似人类的广泛认知能力，能够自主理解抽象概念、迁移知识和主动设定目标；而传统Agent则专注于特定任务的执行，依赖预设规则或训练数据，其能力边界受限且无法处理未预定义的复杂问题。

自主迭代能力：区别于传统Agent依赖人工调优，AGI Agent可通过交互持续优化算法（如Manus的“验证代理”模块通过交叉核验提升任务可靠性）。
跨模态理解：整合文本、图像、代码等多模态数据，实现“手脑并用”式操作（如生成含地图的旅行手册并自动调整预算）。
多智能体协同：采用“规划-执行-验证”架构，模拟人类团队分工（如分解股票分析任务为数据采集、建模、可视化子任务链）。
**

传统Agent仅能处理预设规则内任务（如扫地机器人固定路径清扫），而AGI Agent可应对开放域问题（如医疗场景中综合患者数据生成诊断建议）。

2. 性能评估

GAIA是一个专注于评价AI助手解决现实世界能力的基准测试，本次Manus官方使用了pass@1即首次完成率作为评分标准。从Manus AI官网给出的对比图片中可以看出，在Level 1基础任务方面，Manus以86.5%的准确率碾压OpenAI，证明其在常规场景如信息提取、简单计算下的可靠性。在Level 2复杂推理场景中，虽然没有与OpenAI拉开差距，但也以2.7个百分点小幅领先，体现其在多步骤任务中的稳定性。最后，在Level 3开放指令执行方面，取得了47.6%的突破性成绩，意味着Manus在处理模糊指令时能够更加接近人类水平。
在这里插入图片描述

3. 用法体验

Manus（马努斯）能干什么？Manus能处理复杂任务，提供完整成果，不仅限于建议。它记忆力强，服务器断连后可续任务，且学习能力强，能不断优化性能。
在Manus官网给出的众多用例中，我们选择了几个与各位分享，分别展示了Manus AI在日常生活、生产力还有交互性方面的强大能力。

文档撰写与编辑：

Manus能够轻松撰写文章，包括新闻报道、商业文案等。用户只需提供简单的提示词，Manus就能生成结构完整、内容丰富的文档。它还能制作报告分析及PPT，整合信息并以直观的方式呈现给用户。

编程与代码编写：

Manus具备编写代码的能力，可以完成从简单的脚本到复杂的软件开发的任务。它还能进行前端UI设计，为用户创建美观且功能强大的用户界面。

数据分析与可视化：

Manus能够进行股票分析，提供过去几年的股票价格相关性分析，并编写用于数据分析和可视化的代码。它还能捕捉市场对特定公司的情绪变化，提供市场情绪分析报告。

个性化旅行规划：

Manus能整合旅行信息，为用户创建定制旅行手册，提供个性化的旅行建议和详细行程安排。

3.1 给出一份四月日本旅行计划

首先prompt给出了游玩的需求：具体游玩的日期、时长和出发地点，出行预算以及期望的游玩内容；接着给出了期望得到的反馈形式：需要一个HTML制作的游玩手册，涵盖上面提到的所有内容以及旅行中需要的建议。紧接着Manus就创建了一个Markdown文件用于记录所有的ToDo内容，并且开始一步步搜索相关内容，同时点进不同的网页查看相关内容：

在浏览过程中，它甚至会主动完成向下滚动页面、点击页面元素等操作：

阅读过程中，它也会尝试总结看到的内容，并且一步步完善ToDo表格，直到所有内容都如期完成：

最终，它按照要求给出了一个HTML版本的旅游手册，上面包含了所有需要的内容：

3.2 分析RL工程师应聘信息
Prompt直接提出了自己的需求：把这些候选人的信息整理成一份Excel，并且要根据个人能力对他们进行排名，并同时给出了一个.zip文件让Manus自己去分析。在Manus的思考过程中我们可以看到，它直接对这个.zip文件进行解包，并且由于需要处理的是.pdf文件，Manus直接使用了python进行批量处理：

在分析完简历数量之后，Manus就开始尝试对简历的细节进行分析，在逐个编写候选人的analyze_resume_details.py后，经过多次重复操作，完成了对所有候选人的分析：

最终，Manus对每个人的能力进行了量化分析，给每个人赋予了RL Score作为他的能力的评价，并使用python工具创建了excel表格：

在Excel表格中，Manus把最适合的候选人用高亮进行标识，同时把每个人的个人项目经历、个人成就、RL能力分数以及评价都展示了出来，并在最后给出了自己对每个人的评价，极大简化了HR的工作流程。

4. 在本地安装和配置 Ollama 和 OpenManus 的指南

在这篇博客中，我们将一步步介绍如何在本地安装和配置 Ollama，以及如何使用 OpenManus 来快速启动一个 LLM（大型语言模型）应用程序。通过以下步骤，您将能够轻松地设置环境并开始使用这些工具。

4.1 安装 Ollama

首先，打开终端并运行以下命令来安装 Ollama：

curl -fsSL https://ollama.com/install.sh | sh

安装完成后，您可以检查 Ollama 服务的状态，以确保它已成功运行：

systemctl status ollama

4.2 修改配置

为了使 Ollama 能够满足我们的需求，我们需要进行一些配置修改。首先，安装 net-tools 工具，以便我们可以查看 Ollama 的网络状态：

sudo apt-get install net-tools
netstat -tunlp | grep ollama

接下来，您需要编辑 Ollama 的服务文件，以进行以下配置更改：

4.3 修改端口以允许外部访问

打开 Ollama 的服务文件：

vim /etc/systemd/system/ollama.service

在 [Service] 部分中，添加或修改以下行：

Environment="OLLAMA_HOST=0.0.0.0"

4.4 更改模型存放位置

同样在 ollama.service 文件中，指定模型的存储路径：

Environment="OLLAMA_MODELS=/workspace/ollama/models"

4.5 指定运行 GPU

如果您的系统中有多张 GPU，您可以通过设置 CUDA_VISIBLE_DEVICES 环境变量来指定要使用的 GPU：

Environment="CUDA_VISIBLE_DEVICES=0,1"

别忘了设置您的 API 密钥：

export OLLAMA_API_KEY="sk-11223344qwer"

4.6 重启 Ollama

完成所有配置后，您需要重启 Ollama 服务以应用更改：

systemctl daemon-reload
systemctl restart ollama

您可以通过以下命令运行 Ollama，并查看信息以确认端口已更改：

ollama run qwq

4.7 克隆 OpenManus 仓库

接下来，我们将安装 OpenManus。首先，克隆其 GitHub 仓库：

git clone https://github.com/mannaandpoem/OpenManus.git
cd OpenManus

然后安装所需的依赖项：

pip install -r requirements.txt

4.8 配置 OpenManus

OpenManus 需要配置 LLM API 的相关信息。请按照以下步骤设置配置文件：

在 config 目录中创建 config.toml 文件（可以从示例文件复制）：
cp config/config.example.toml config/config.toml

编辑 config/config.toml 文件，添加您的 API 密钥并自定义设置：

# Global LLM configuration
[llm]
model = "qwq"
base_url = "http://localhost:11434/v1"
api_key = "sk-11223344qwer"
max_tokens = 4096
temperature = 0.0

# Optional configuration for specific LLM models
[llm.vision]
model = "claude-3-5-sonnet"
base_url = "https://api.openai.com/v1"
api_key = "sk-..."

4.9 快速启动 OpenManus

一切准备就绪后，您可以通过以下命令启动 OpenManus：

python main.py

然后，您可以通过终端输入您的想法，开始与 LLM 互动。

如果您想使用不稳定版本，您也可以运行：

python run_flow.py

5. 总结

我们不难发现，Manus确实可以一次性完成其他AI需要很多次提示才能完成的操作，并且直接实现想法是其他AI难以企及的。但是所有展示的用例中，Manus最多只能完成编写HTML或者执行python这样的操作，说明通用型AI智能体还有相当大的扩展空间，而且可预见的，这样的通用型AI智能体会对服务器性能提出相当大的挑战。我们这里也提供了 Ollama 版本的QWQ深度思考和 OpenManus结合的样本。现在，您可以开始构建自己的 LLM 应用程序，探索更多的可能性！如果您在安装或配置过程中遇到问题，请随时在评论区留言，我们会尽快为您解答