Open - AutoGLM开源：解锁AI手机时代，人人皆可打造智能终端助手

原创已于 2025-12-10 08:08:08 修改 · 1.4k 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#开源 #人工智能 #智能手机

于 2025-12-10 08:07:03 首次发布

人工智能专栏收录该内容

35 篇文章

订阅专栏

近期AI终端领域喜讯频传，行业创新活力持续迸发：前几天，阶跃星辰正式开源GELab-Zero-4B-preview模型，为AI技术落地终端场景提供了新的基础支撑；12月1日，字节跳动豆包团队发布手机助手技术预览版，该版本通过与中兴在操作系统层面深度合作，已可在nubia M153工程样机上实现跨应用复杂操作、自然语音交互等进阶功能。在这样的行业背景下，2025年12月9日，智谱AI正式宣布开源核心AI Agent模型Open - AutoGLM，被业界视为手机产业的“智驾时刻”——它首次将“AI真正学会使用手机”的能力开放给全行业，让“每台手机都能成为AI手机”的愿景从概念走向现实。不同于传统语音助手的简单交互，Open - AutoGLM实现了跨APP、长链路的拟人化操作，其开源举动更是打破了少数厂商对AI手机核心能力的垄断，为开发者群体搭建起全新的技术底座。

开源核心价值：从技术开放到生态共建

智谱选择以“模型MIT开源许可证+代码Apache - 2.0开源许可证”的形式开放Open - AutoGLM，并非简单的技术共享，而是旨在构建一个全行业可参与的AI手机技术生态。其核心价值主要体现在三个层面：

核心观点：Open - AutoGLM的开源，本质是将“AI用手机”这一核心能力转化为行业公共底座，打破少数厂商的垄断，让开发者、硬件厂商、企业用户都能基于此实现创新。

在这里插入图片描述

1. 降低技术门槛：“拿来就用”的完整解决方案

此次开源并非仅开放核心模型，而是提供了一整套可直接落地的技术方案，包括：训练好的核心模型、Phone Use能力框架与工具链、覆盖50+高频中文App的可跑通Demo、Android适配层与示例工程，以及详尽的技术文档和快速上手指南。这意味着无论是大型硬件厂商还是个人开发者，都无需重复“啃技术难题、踩坑、重写框架”，只需基于开源资源即可快速构建具备屏幕感知能力的AI助手，大幅缩短研发周期。

2. 隐私保护革新：数据与控制权留在用户侧

AI操控手机的核心痛点之一是隐私安全——若AI能读取聊天记录、支付信息、照片等敏感数据，极易引发隐私泄露风险。Open - AutoGLM通过“开源+私有化部署”给出了终极解法：企业和开发者可在自己的合规环境中完整掌控数据、日志和权限，支持本地部署模式，模型运行和数据处理均在用户设备端完成，数据不出手机；同时，训练过程在云端虚拟沙箱中进行，与真实用户数据严格隔离，从架构设计上杜绝了隐私泄露的可能，也瓦解了互联网大厂以“隐私泄露”为由进行围剿的合法性基础。

3. 开源许可证优势：自由修改与商业落地兼容

模型采用MIT开源许可证，代码采用Apache - 2.0开源许可证，这意味着开发者可自由修改、拆分、改造组件，将其融入自己的系统或产品中，无论是用于学术研究、个人项目开发，还是商业产品落地，都具备极高的灵活性。这种开放的许可模式，为生态创新提供了充足的空间。

在这里插入图片描述

开发者快速上手：从获取资源到首次运行

对于想要快速体验Open - AutoGLM的开发者，可遵循以下步骤开启实践：

1. 获取开源资源

Open - AutoGLM的完整代码库已托管在GitHub仓库，地址为：github.com/zai-org/Open-AutoGLM。克隆仓库后，可获得模型训练脚本、应用适配接口、多场景测试用例、Demo工程等全部核心资源。

2. 核心组件了解

核心模型：AutoGLM - Phone - 9B视觉大模型，负责界面理解与动作决策；
Phone Use框架：封装了点击、滑动、输入、截图解析等基础操作API；
Android适配层：提供与安卓系统的交互接口，支持主流安卓版本；
Demo工程：涵盖外卖点单、机票预订、微信红包发送等高频场景，可直接运行验证效果。

3. 部署与测试

本地部署需满足基础硬件要求，按照文档中的环境配置指南安装依赖库；若无需本地训练，可直接调用预训练模型，通过修改Demo中的任务指令（如将“预订机票”改为“点一份奶茶外卖”），测试模型在不同场景下的执行效果。此外，项目支持云端虚拟手机集群部署，适合需要大规模训练或批量测试的开发者。

行业影响与未来展望

Open - AutoGLM的开源，无疑将加速AI手机行业的发展进程。在此之前，“AI用手机”的能力多被少数厂商掌控，开发者的创新空间受限于平台接口开放程度；而Open - AutoGLM的出现，让硬件厂商可基于此打造AI原生手机，开发者可开发垂直领域应用（如医疗挂号助手、银行事务自动化、企业考勤自动化等），个人开发者也能在小众场景中实现技术落地。

从行业趋势来看，AI Agent之于手机，正如自动驾驶之于汽车——它将推动手机从“功能叠加”向“原生交互”演进，让手机真正成为“全能管家”式的下一代计算入口。未来，随着开源生态的完善，Open - AutoGLM有望支持更多设备类型（如平板、智能手表）和更多语言场景，进一步拓展AI Agent的应用边界。

对于开发者而言，Open - AutoGLM不仅是一个工具，更是一个技术跳板——它将智谱32个月的研发积累转化为行业的起跑线，无论是技术研究（如优化强化学习算法、提升界面理解精度）还是商业创新（如开发专属AI助手产品），都能在此基础上快速推进。

结语

Open - AutoGLM的开源，是AI Agent领域的一次重要突破，更是行业生态共建的一次有益实践。它用技术开放打破垄断，用架构设计保障隐私，用完整工具链降低门槛，让“人人可造AI手机”从愿景变为现实。对于开发者而言，此刻正是入局AI终端助手开发的最佳时机——不妨克隆GitHub仓库，亲手体验AI自主操作手机的神奇效果，或许下一个改变行业的创新产品，就源于你的实践。