机器人又拿下一种家务:10小时学会煮咖啡,仅需观看人类演示视频

部署运行你感兴趣的模型镜像
丰色 发自 凹非寺
量子位 | 公众号 QbitAI

上周斯坦福炒虾机器人炸场之后,又火了一个煮咖啡机器人。

ac774bcf2a644b1d09494521612610ae.png

它的厉害之处在于通过观看人类的示范视频,仅需10小时端到端训练,就能学会并完全自主搞定这一任务。

当然,更准确地来说是操作咖啡机:

只见它打开机盖、放入咖啡包,再按下开始按钮,整个过程一气呵成,无需任何远程遥控

f7d89263192001823b3415ac44ec9c4b.gif

很快,一杯咖啡就可以端走享用:

df706f7deb9d8cac8e3f72b045e9e01c.gif

注意了,以上演示视频,没有任何加速处理。这就是该机器人目前可以达到的实际操作速度。

而除了这些,它还具备自主纠错功能:

如果咖啡包没有放正,不用人类提醒,它自己就能调整好。

c07d60d447077042e37eb1fa9891093c.gif

对此,前谷歌DeepMind研究员(也是该机器人的开发人员)直接就是一个转发点赞,并再次强调:

所有行为包括纠错,完全自主。

6f1365e700556ba62fceb69f9b07a9a4.png

公司创始人Brettt Adcock称,这就是机器人技术的ChatGPT时刻。

688b78ce26c4e3975e527089bd926d42.png

不管是不是每个人都赞同这个说法,但网友被它的训练速度所折服是没得说。

10个小时真的很优秀,快进到使用研磨机和法压壶,估计很快视频里个咖啡机也要失业了。(手动狗头)

281561cee8d20be6e208d601a6fd7928.png

所以,这个机器人具体什么来头?

10小时端到端训练搞定煮咖啡

如上这个机器人来自一家商业公司,名叫Figure。

91d7745172ecbaf73511db170cbdacbb.png

Figure总部位于美国,成立于2022年,专攻通用人形机器人。

创始人Brett Adcock毕业于美国佛罗里达大学,26岁时创办了一家在线人才市场网站,后被同行1.1亿美元收购,然后又创办了一家生产全电动垂直起降飞机的航天公司,作家27亿美元上市。

cd59c8133844590a030875461d57800c.png

如今,这家机器人公司Figure也可谓吸金无数,先是在去年5月拿到7000万美元A轮融资,两个月后又获得英特尔900万美元投资。

去年10月——大概成立一年之际,Figure发布首款人形机器人,代号Figure 01。

它走起路来是这样的:

25b20bb3d83c1ba91e3992f1497dde61.gif

我们今天看到的煮咖啡演示则正是由它完成。

而学会这项技能,只花了它10个小时的训练时间——

Figure 01采用的是端到端神经网络,这边接收人类煮咖啡的视频,那边就能输出动作轨迹,让机器人通过模仿,最终完成自主操作。

以此类推,让它学会别的任务,也只需要输入相应的视频即可。

至于具体实现细节,官方没有透露。

不过,抛去10小时就完成训练不谈,对于让机器人学会煮咖啡这类任务本身来说,已经不是一件难事儿了。

其核心就是模仿学习,入选CoRL’22(机器人,学习会议)的VIOLA可以做到(它是一个以对象为中心的模仿学习框架,基于Transformer进行推理,擅长长程任务,比最先进的模仿学习算法性能高出45.8%);

188a4a5c66124f158b336946bc59a805.gif

来自谷歌、今年6月发布的HYDRA,也专攻于此,擅长各种粗粒度和细粒度控制,并可自如切换。

来自斯坦福大学的AME,基于路点(Waypoint)实现,对于煮咖啡这种任务也毫不含糊,只不过速度慢很多。

2fcbb8c96348a08042edcf93a207e1fe.gif

还有英伟达的HITL-TAMP、MimicGen等研究成果,也就是机器人模仿学习相关,就不一一介绍了。

8d6ecb29b71ed78d8a66caea6e6246c6.png

2040年前,谁能成功挑战史蒂夫咖啡测试?

尽管Figure 01的表现很不错(比如速度就很快),但不少网友还是评价:

这和想象中的煮咖啡机器人还有一点距离。

比如它能不能拿起杯子、将其放到咖啡机下,沏完之后再添加奶油和糖,再将杯子放到托盘上,端到人面前?

3329a30dfc361aa1664b3379f0142616.png

事实上,苹果公司联合创始人Steve Wozniak曾提出一个评估机器人自主能力的咖啡测试。

它要求机器人从进入一个陌生的家中开始,然后找到厨房,识别工具(例如咖啡机、水壶)和材料(咖啡豆、糖、牛奶等),最终做好一杯咖啡,且全程不超过20分钟。

这个测试考验机器人在未知环境中导航、识别物体、操作工具和材料以及遵循人类命令等一系列能力。
有人发起过投票,问2040年之前能否有这样的机器人诞生?

结果有89%的人投了yes。

e7ec7408b4308e7cad7a3e32b2db01f2.png

你认为有希望吗?

参考链接:
[1]https://twitter.com/Figure_robot/status/1743985067989352827
[2]https://twitter.com/Figure_robot
[3]https://manifold.markets/MatthewBarnett/will-a-robot-be-created-that-is-cap

—  —

点这里👇关注我,记得标星哦~

您可能感兴趣的与本文相关的镜像

Langchain-Chatchat

Langchain-Chatchat

AI应用
Langchain

Langchain-Chatchat 是一个基于 ChatGLM 等大语言模型和 Langchain 应用框架实现的开源项目,旨在构建一个可以离线部署的本地知识库问答系统。它通过检索增强生成 (RAG) 的方法,让用户能够以自然语言与本地文件、数据库或搜索引擎进行交互,并支持多种大模型和向量数据库的集成,以及提供 WebUI 和 API 服务

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值