用自然语言控制你的电脑:Windows-MCP 项目实测

该文章已生成可运行项目,

1. 什么是 Windows-MCP?

一句话总结:
Windows-MCP 是一个开源的 MCP 服务器,把大语言模型(LLM)和 Windows 桌面「打通」,让 AI 可以像人一样点击、输入、查文件、跑程序。

2. 核心能力

功能

一句话说明

典型场景

文件浏览

列出/打开任意目录

让 AI 帮你找日志、整理桌面

应用控制

启动、关闭、切换窗口

“打开 Excel 并新建表格”

UI 自动化

鼠标、键盘、截图

自动填写表单、批量改图

QA 测试

读取 UI 状态并断言

让 AI 替你跑回归测试

零视觉依赖

不靠截图,纯系统 API

速度更快、兼容高分屏

3. 真实体验数据

  • • 平均延迟:1.5–2.3 秒/次操作

  • • 系统占用:Python 单进程 < 50 MB 内存

  • • 首次配置:3 条命令,2 分钟完成(见下方教程)

4. 3 步上手(Windows 实测)

① 准备环境

# 安装 Python 3.13+
winget install Python.Python.3.13
# 或官网下载安装包

② 一键启动

git clone https://github.com/CursorTouch/Windows-MCP.git
cd Windows-MCP
uv sync          # 自动装依赖
uv run server    # 启动 MCP 服务器

③ 接入 Cursor / Claude Desktop

在项目根目录新建 .cursor/mcp.json

{
  "mcpServers":{
    "windows":{
      "command":"uv",
      "args":["run","server"],
      "cwd":"<你的Windows-MCP路径>"
    }
}
}

重启 Cursor,看到 ✅ 即成功。

5. 与同类方案对比

方案

是否开源

依赖视觉

最低延迟

扩展难度

Windows-MCP

1.5 s

改 Python 脚本即可

传统 RPA

3–5 s

需要商业 IDE

纯浏览器插件

2–4 s

仅限 Web

6. 安全提示

  • • 默认只监听 127.0.0.1,不外露端口

  • • 所有操作需用户显式授权(Cursor 会弹窗)

  • • 代码 MIT 协议,可自审、可二开

7. 下一步

  • • GitHub 地址:github.com/CursorTouch/Windows-MCP

  • • 欢迎提 Issue、PR,或直接在 Discussion 分享你的自动化脚本!

本文章已经生成可运行项目
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值