刚刚,谷歌ViT核心骨干集体投奔OpenAI:他们为Sora打下基础

明敏 白小交 发自 凹非寺
量子位 | 公众号 QbitAI

爆炸消息——

ViT三大核心作者集体离职谷歌DeepMind。下一站:OpenAI

他们分别是翟晓华(Xiaohua Zhai)、卢卡斯·拜尔(Lucas Beyer)、亚历山大·科列斯尼科夫(Alexander Kolesnikov)。

相关消息已被本人证实,三人均官宣了新动向。

50174165dba33820928ae87beb53424a.png
d184e80b0752e326e6408d54f80cb4f2.png
5db8c1fa16bcfce9c1536bd10d294555.png

2021年,他们三人作为共同一作的计算机视觉领域神作ViT发布即刷新ImageNet最高分。

这项研究证实了CNN在CV领域不是必需的,Transformer从NLP跨界,一样可以取得先进效果。开创了Transformer在CV领域应用的先河。

目前这篇论文被引用量已超过4.9万

e7271426c317960da87722a1b34e90f7.png

此外,他们还共同提出了SigLIP、PaliGamma等SOTA级工作。

几周后,他们将正式加入OpenAI苏黎世实验室。

值得一提的是,Wired方面消息称,三人是被OpenAI挖走的。

网友评论:能撬动这一“铁三角”黄金组合,OpenAI真的太幸运了。

8e5a8699b6dbe2d5815431a578fcd0ec.png

ViT三大核心作者投奔OpenAI

Xiaohua Zhai(翟晓华)

此前他是Google DeepMind 的高级研究员,领导着苏黎世一个多模态研究小组。重点研究多模态数据(WebLI)、开放权重模型 ( SigLIP、PaliGemma )以及文化包容性。

目前谷歌学术引用数超六万多。

0519a5a2760e3a4ac0f86fbc09e89542.png

2014年他毕业于北京大学,获得计算机系博士学位;本科毕业于南京大学。一毕业就前往谷歌苏黎世工作。

7f5304b94dace727cb20c08b8e646312.jpeg

Lucas Beyer

这位同样也是谷歌DeepMind苏黎世小组的一位成员,共同领导着DeepMind的多模态研究团队和基础设施。

目前已经撰写超50篇论文,被CVPR、NeurIPS、ICCV 等这些顶级会议接收。

33b2ad8369334e10e3ff545b6e5c0c48.png

据他个人官网中介绍,他在比利时长大,曾梦想制作电子游戏以及从事AI研究。自我认定为「自学成才的黑客和研究科学家,致力于创造飞凡实物」。

他在德国亚琛工业大学学习机械工程,并在那里获得了机器人感知和计算机视觉博士学位。2018年加入谷歌。

e98e1366ee696a68a218907b7ece0fba.jpeg

Alexander Kolesnikov

2018年以来,他就在谷歌大脑,现为DeepMind团队工作。之前主要成就包括训练SOTA视觉模型*(从2019年到2021年都实现了ImageNet SOTA);开放权重模型(SigLIP和PaliGemma),以及神经架构方面的工作:BiT、ViT、MLP-Mixer和FlexiViT。

除此之外,编写灵活、高性能的研究基础设施,尤其是Jax

此前,他在奥地利科学技术研究所(ISTA)攻读博士学位,研究方向是弱监督学习和图像生成模型。

c1372ffc991eae4f7f105fc3f0322a54.jpeg

曾是谷歌CV的“黄金铁三角”

在谷歌任职期间,三人多次合作并带来了影响领域发展的重要工作。

其中最重要的一篇莫过于ViT。

这篇研究验证了Transformer架构在计算机视觉领域的通用性。在它的基础上衍生出了Swin Transformer、DeiT(Data-efficient Image Transformers)等。

它创新性提出将图像分割成固定大小的块(patches),并将每个块视为一个序列元素,与NLP中的单词类似。然后,这些块通过变换器进行处理。

902db44887702814b53acda931355fe0.png

在许多视觉任务中,ViT在性能上超过了传统的CNN模型,尤其是在大规模数据集上进行训练时表现尤为突出。例如,在ImageNet分类任务中,ViT取得了与最先进的CNN模型相当甚至更好的结果。

b8069d1a25b5e16fd745d388584ca084.png

此外他们还合作推出了MLP-Mixer、BiT(CV界的BERT)等领域内知名工作。

参考链接:
[1]https://www.wired.com/story/openai-hires-deepmind-zurich/
[2]https://kolesnikov.ch/
[3]https://sites.google.com/view/xzhai
[4]https://lucasb.eyer.be/

12月11日

「MEET2025智能未来大会」报名啦

💫 李开复博士、周志华教授、智源研究院王仲远院长都来量子位MEET2025智能未来大会探讨行业破局之道了!

💥 最新嘉宾阵容在此点击报名参会欢迎来到MEET智能未来大会,期待与您一起预见智能科技新未来!

7d1ca605f6a99e49569b29e8d8d3514c.png

bbc104dd1124b49c199d49b4197d38fa.png

79ef6e7b683ec1b20598bbc34d662fcf.png

a672f7a8b69416cad975b71f86492914.png

bb31a9d951a1d19f092bf8d384346f5e.png

bff54240cfcd8e640a2bb3eee1b50eea.png

d0e5df28dd427ca6e09e6676f184dfb4.png

1dd12b45948b9f40aeb827fa99d3869e.png

17a6e584902aa51f9b4fac9c5a787612.png

7370af461d9305652c0f3a298329de00.png

9a8bdd1ddc883be1fdcb7e7921a2f9c3.png

50292ff3809f5833c8ae12102895725b.png

efdf0ea32b5d1abe89d022d49ec54f11.png

0e0eeef31ba690abae0d0a752ccd6f98.png

d1a725f2fcb5069222b3e10a75859e1f.png

89ace05713a3751e617327ab5461f72f.png

53d774d5444c28f1b7dc543232e11ff0.png

outside_default.png

左右滑动查看最新嘉宾阵容

outside_default.png

点这里👇关注我,记得标星哦~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值