图 1:双合模 ALOHA 机器人上的 OpenVLA-OFT+。我们的优化微调 (OFT) 配方通过提高推理效率、模型质量和输入输出灵活性来增强微调的 OpenVLA 策略。由此产生的 OpenVLA-OFT+ 策略在现实世界的双手动机器人上以高控制频率 (25 Hz) 执行各种灵巧的作任务。“+” 后缀表示功能线性调制 (FiLM) 的集成[35],这加强了在准确理解语言对成功至关重要的任务中的语言基础。
论文解析 - 解析OpenVLA-OFT——让视觉-语言-行动模型更快、更准的微调新范式
于 2025-03-04 09:38:51 首次发布