目录
4.4.1 VLM/LLM as a Planner: 如何将自然语言指令转化为机器人可执行的动作序列
4.4.2 Fine-tuning: 在机器人特定任务上微调预训练大模型
示例1:VLM as a Zero-shot Planner (基于 LLaVA)
基础模型,特别是大规模语言模型 (LLM) 和视觉语言模型 (VLM),正以前所未有的深度和广度重塑人工智能领域。它们强大的泛化能力、上下文理解能力和推理能力为解决机器人学中长期存在的挑战——尤其是高级语义理解、长期任务规划和人机交互——提供了革命性的新范式。本手册旨在为该领域的研究人员提供一份深入的指南,剖析其核心原理并展示如何在实践中高效地应用这些模型。
订阅专栏 解锁全文
132

被折叠的 条评论
为什么被折叠?



