近期AI终端领域喜讯频传,行业创新活力持续迸发:前几天,阶跃星辰正式开源GELab-Zero-4B-preview模型,为AI技术落地终端场景提供了新的基础支撑;12月1日,字节跳动豆包团队发布手机助手技术预览版,该版本通过与中兴在操作系统层面深度合作,已可在nubia M153工程样机上实现跨应用复杂操作、自然语音交互等进阶功能。在这样的行业背景下,2025年12月9日,智谱AI正式宣布开源核心AI Agent模型Open - AutoGLM,被业界视为手机产业的“智驾时刻”——它首次将“AI真正学会使用手机”的能力开放给全行业,让“每台手机都能成为AI手机”的愿景从概念走向现实。不同于传统语音助手的简单交互,Open - AutoGLM实现了跨APP、长链路的拟人化操作,其开源举动更是打破了少数厂商对AI手机核心能力的垄断,为开发者群体搭建起全新的技术底座。
开源核心价值:从技术开放到生态共建
智谱选择以“模型MIT开源许可证+代码Apache - 2.0开源许可证”的形式开放Open - AutoGLM,并非简单的技术共享,而是旨在构建一个全行业可参与的AI手机技术生态。其核心价值主要体现在三个层面:
核心观点:Open - AutoGLM的开源,本质是将“AI用手机”这一核心能力转化为行业公共底座,打破少数厂商的垄断,让开发者、硬件厂商、企业用户都能基于此实现创新。

1. 降低技术门槛:“拿来就用”的完整解决方案
此次开源并非仅开放核心模型,而是提供了一整套可直接落地的技术方案,包括:训练好的核心模型、Phone Use能力框架与工具链、覆盖50+高频中文App的可跑通Demo、Android适配层与示例工程,以及详尽的技术文档和快速上手指南。这意味着无论是大型硬件厂商还是个人开发者,都无需重复“啃技术难题、踩坑、重写框架”,只需基于开源资源即可快速构建具备屏幕感知能力的AI助手,大幅缩短研发周期。
2. 隐私保护革新:数据与控制权留在用户侧
AI操控手机的核心痛点之一是隐私安全——若AI能读取聊天记录、支付信息、照片等敏感数据,极易引发隐私泄露风险。Open - AutoGLM通过“开源+私有化部署”给出了终极解法:企业和开发者可在自己的合规环境中完整掌控数据、日志和权限,支持本地部署模式,模型运行和数据处理均在用户设备端完成,数据不出手机;同时,训练过程在云端虚拟沙箱中进行,与真实用户数据严格隔离,从架构设计上杜绝了隐私泄露的可能,也瓦解了互联网大厂以“隐私泄露”为由进行围剿的合法性基础。
3. 开源许可证优势:自由修改与商业落地兼容
模型采用MIT开源许可证,代码采用Apache - 2.0开源许可证,这意味着开发者可自由修改、拆分、改造组件,将其融入自己的系统或产品中,无论是用于学术研究、个人项目开发,还是商业产品落地,都具备极高的灵活性。这种开放的许可模式,为生态创新提供了充足的空间。

开发者快速上手:从获取资源到首次运行
对于想要快速体验Open - AutoGLM的开发者,可遵循以下步骤开启实践:
1. 获取开源资源
Open - AutoGLM的完整代码库已托管在GitHub仓库,地址为:github.com/zai-org/Open-AutoGLM。克隆仓库后,可获得模型训练脚本、应用适配接口、多场景测试用例、Demo工程等全部核心资源。
2. 核心组件了解
- 核心模型:AutoGLM - Phone - 9B视觉大模型,负责界面理解与动作决策;
- Phone Use框架:封装了点击、滑动、输入、截图解析等基础操作API;
- Android适配层:提供与安卓系统的交互接口,支持主流安卓版本;
- Demo工程:涵盖外卖点单、机票预订、微信红包发送等高频场景,可直接运行验证效果。
3. 部署与测试
本地部署需满足基础硬件要求,按照文档中的环境配置指南安装依赖库;若无需本地训练,可直接调用预训练模型,通过修改Demo中的任务指令(如将“预订机票”改为“点一份奶茶外卖”),测试模型在不同场景下的执行效果。此外,项目支持云端虚拟手机集群部署,适合需要大规模训练或批量测试的开发者。
行业影响与未来展望
Open - AutoGLM的开源,无疑将加速AI手机行业的发展进程。在此之前,“AI用手机”的能力多被少数厂商掌控,开发者的创新空间受限于平台接口开放程度;而Open - AutoGLM的出现,让硬件厂商可基于此打造AI原生手机,开发者可开发垂直领域应用(如医疗挂号助手、银行事务自动化、企业考勤自动化等),个人开发者也能在小众场景中实现技术落地。
从行业趋势来看,AI Agent之于手机,正如自动驾驶之于汽车——它将推动手机从“功能叠加”向“原生交互”演进,让手机真正成为“全能管家”式的下一代计算入口。未来,随着开源生态的完善,Open - AutoGLM有望支持更多设备类型(如平板、智能手表)和更多语言场景,进一步拓展AI Agent的应用边界。
对于开发者而言,Open - AutoGLM不仅是一个工具,更是一个技术跳板——它将智谱32个月的研发积累转化为行业的起跑线,无论是技术研究(如优化强化学习算法、提升界面理解精度)还是商业创新(如开发专属AI助手产品),都能在此基础上快速推进。
结语
Open - AutoGLM的开源,是AI Agent领域的一次重要突破,更是行业生态共建的一次有益实践。它用技术开放打破垄断,用架构设计保障隐私,用完整工具链降低门槛,让“人人可造AI手机”从愿景变为现实。对于开发者而言,此刻正是入局AI终端助手开发的最佳时机——不妨克隆GitHub仓库,亲手体验AI自主操作手机的神奇效果,或许下一个改变行业的创新产品,就源于你的实践。
852

被折叠的 条评论
为什么被折叠?



