智元发布首个通用具身基座大模型GO-1

92e437fb3ba1078693d21cbf8b4dcc64.png

3月10日消息,今天,智元宣布发布首个通用具身基座模型——智元启元大模型(Genie Operator-1)。


2024年底,智元推出了 AgiBot World,包含超过100万条轨迹、涵盖217个任务、涉及五大场景的大规模高质量真机数据集。基于AgiBot World,智元今天正式发布智元通用具身基座大模型 Genie Operator-1(GO-1)。

据官方介绍,该大模型提出了Vision-Language-Latent-Action (ViLLA) 架构,该架构由VLM(多模态大模型) + MoE(混合专家)组成,其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力,MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力,三者环环相扣,实现了可以利用人类视频学习,完成小样本快速泛化,降低了具身智能门槛,并成功部署到智元多款机器人本体,持续进化。

据了解,智元总结了GO-1大模型四大特点:

首先,人类视频学习:GO-1大模型可以结合互联网视频和真实人类示范进行学习,增强模型对人类行为的理解,更好地为人类服务。

其次,小样本快速泛化:GO-1大模型具有强大的泛化能力,能够在极少数据甚至零样本下泛化到新场景、新任务,降低了具身模型的使用门槛,使得后训练成本非常低。

第三,一脑多形GO-1大模型是通用机器人策略模型,能够在不同机器人形态之间迁移,快速适配到不同本体,群体升智。

第四,持续进化:GO-1大模型搭配智元一整套数据回流系统,可以从实际执行遇到的问题数据中持续进化学习,越用越聪明。

智元认为,GO-1大模型将加速具身智能的普及,机器人将从依赖特定任务的工具,向着具备通用智能的自主体发展,在商业、工业、家庭等多领域发挥更大的作用,通向更加通用全能的智能未来。(网易科技/崔玉贤)

—END—

<think>好的,用户想了解基座大模型的定义和原理,我需要根据提供的引用资料来组织答案。首先,根据引用[2],基座模型是通过分解大模型为子模型,每个处理特定任务,再结合结果。引用[1]提到大模型的参数多,而基座可能属于其中的大型或极大型。引用[3]的分类帮助说明基座模型的规模,可能属于10亿参数以上。引用[4]讲评测,但原理部分可能涉及训练和优化。需要将这些整合,用中文清晰解释定义和原理,并生成相关问题。确保使用正确的LaTeX格式,行内公式用$,独立公式用$$,比如参数数量$W$矩阵。检查引用标注是否正确,比如基座模型的定义来自引用[2],参数分类来自引用[3]。然后生成相关问题,比如基座模型的应用、与微调的关系等。注意避免使用Markdown,保持口语化但结构清晰。</think>基座大模型的定义及原理如下: ### 一、定义 基座大模型(Base Model)是一种大规模参数化的机器学习模型,其核心特征是将复杂的任务拆解为多个子任务,通过分层或分模块的方式构建模型结构。根据参数规模分类,基座大模型通常属于**极大型模型**(参数≥10亿)[^3]。例如,训练参数$W$构成的矩阵规模可达到千亿甚至万亿级别[^1]。 ### 二、原理 1. **模型分解** 基座模型通过将整体任务分解为多个子任务(如文本生成、语义理解等),每个子模块专注于特定功能,最终通过集成方法(如加权融合或注意力机制)输出结果[^2]。数学表示为: $$ P(y|x) = \sum_{i=1}^n \alpha_i P_i(y|x) $$ 其中$P_i$为子模型预测概率,$\alpha_i$为权重系数。 2. **参数规模与能力** 大参数量的优势在于: - 覆盖更广泛的数据分布(如多语言、多领域文本)[^1] - 通过海量数据训练增强泛化能力,例如模型损失函数$L(\theta)=-\mathbb{E}_{(x,y)\sim D}[\log P(y|x;\theta)]$的优化过程[^4] 3. **训练与评测** 基座模型的训练需结合分布式计算与优化算法(如AdamW),评测则通过多任务指标(如BLEU、ROUGE)指导参数调整[^4]。 ### 三、典型应用 1. 自然语言处理(对话生成、文本摘要) 2. 多模态任务(图文理解) 3. 作为下游任务的预训练基础
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值