谷歌AI新星转投Pika:视频生成Lumiere一作,担任创始科学家

白交 发自 凹非寺
量子位 | 公众号 QbitAI

视频生成进展如火如荼,Pika迎来一位大将——

谷歌研究员Omer Bar-Tal,担任Pika创始科学家

一个月前,还在谷歌以共同一作的身份发布视频生成模型Lumiere,效果十分惊艳。

c9343398d8afcfdcc41e3237f0397657.jpeg

当时网友表示:谷歌加入视频生成战局,又有好戏可看了。

8196ca7cfef8fb650e4f3c1fb470f2a2.gif

Stability AI CEO、谷歌前同事等在内一些业内人士送上了祝福。

f315d604659a514b5847fa60458edabe.png
8f9dff324ea96e445bee25977f9d639e.png

Lumiere一作,刚硕士毕业

Omer Bar-Tal,2021年本科毕业于特拉维夫大学的数学与计算机系,随后前往魏茨曼科学研究所攻读计算机硕士,主要聚焦于图像和视频合成领域的研究。

其论文成果多次被顶会接收,比如Text2LIVE(ECCV 2022 Oral)、MultiDiffusion(ICML 2023)、TokenFlow(ICLR 2024)。

以TokenFlow为例,他们提出了一种框架,基于扩散模型实现文本驱动的视频编辑,支持视频编辑任务无需任何训练或微调。

33ff15fb813adb9d05813f36763b8aa0.png

此次加盟Pika前,他曾是谷歌研究院以Student Researcher身份待了9个月,最终经过7个月的研究以共同一作身份推出了Lumiere。这时候硕士应该还没有毕业。

d2527f989860394dc1ede152c0b4e11c.png

Lumiere的创新点在于,提出了时空U-Net(STU-Net)架构:将视频在空间和时间两个维度同时进行下采样和上采样,在网络的中间层得到视频的压缩时空表示。

在学习了3000万视频之后,Lumiere可支持文生视频、视频编辑修复、图片转视频以及视频风格化等多种功能。

当时Jeff Dean盛赞:多模态视频生成革命正在发生

8b49ed64265aca924cd390b5e32f6354.png

威尔史密斯吃面(Pika版)

官宣加盟Pika消息之后,官方以及投资人等也送上了祝福。

4dfd15337a36baf955c55840c1e49a44.png

前几天,还有位Pika华人研究员Yilun Du发布了篇文章, 不过应该刚从MIT博士毕业(也可能还没毕业),论文单位仍是MIT。

c8a3004c89a736193f89e406415369ff.png

另外在官网还在继续招人中。

97e77d111c68927fc10b12ea90506672.png

对了,他们刚刚发布了威尔史密斯吃面(Pika版),来看看这个效果如何?

报名中!

2024年值得关注的AIGC企业&产品

量子位正在评选2024年最值得关注的AIGC企业、 2024年最值得期待的AIGC产品两类奖项,欢迎报名评选!

评选报名截至2024年3月31日 6b3500c1e3263172354fba568c61af54.png

a7507134e05589d4c009d6729fc97c91.png

中国AIGC产业峰会同步火热筹备中,了解更多请戳:在这里,看见生成式AI的应用未来!中国AIGC产业峰会来啦!

商务合作请联络微信:18600164356 徐峰

活动合作请联络微信:18801103170 王琳玉

点这里👇关注我,记得标星噢

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值