Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能

白交 发自 凹非寺
量子位 | 公众号 QbitAI

谷歌の“反击”来了!

Gemini被Sora抢走的风头,现在有抢回来的势头了。

在最新实测中,Gemini 1.5能分析Sora视频是否AI生成。

是直接给出当中关键因素的那种。

比如这个经典的猫猫视频,Gemini 1.5直言:

它的眼睛和毛都看起来都不像是真的。

7c2a655c7a8a7f62a02270cca4da2cfa.png

还有像这段生成视频,Gemini 1.5都能说出个一二三造假细节来~

6f78803779ebf0e1533bbddd199f3842.png

都说魔法打败魔法,结果Sora发布这才没几天,就火速被Gemini 1.5“抓出现行”。

对于Gemini 1.5第一波实测结果,网友直呼:that’s scary good,并称其为“游戏规则的改变者”。

c655be5785d592fffdd0a052990712a4.png
f45f5e5e58cc4bfefc01dd3596748534.png

Gemini 1.5第一波实测来了

Gemini 1.5版本突然发布,结果被对面Sora的光芒所掩盖。

5301ab267d280b9306972e989fc56808.jpeg

但即便如此,其模型性能的重大升级,尤其是支持100万token上下文窗口,仍让网友们印象深刻。

现在一些博主陆陆续续地拿到了访问资格,开始了第一波实测。

除了能鉴别生成视频真假之外,还有这些令人印象深刻的功能。

1、分解并理解长视频

比如一场14分钟的NBA扣篮视频,Gemini 1.5能判断出哪个扣篮得分最高, 并给出其中扣篮细节。

0c42ab64056a543b6fe73631f0ea4c2c.png

整个响应过程大致只需要55秒左右。

2、理解长文本内容,进行比较分析

博主投喂了《星际穿越》和《星际探索》两个完整的电影脚本,合起来接近10万tokens,要求Gemini 1.5分析比较,以帮助决定观看哪部电影为好。

结果只需三十几秒,就给出了完整详尽的分析报告。

e5d0668551f980cf6d635174563712e4.gif

这样一看,分析其中的剧情台词也就显得小儿科了。

(分析电影中最鼓舞人心的三句话)

64f923f555e401cb02ee6b9aedd16995.png

3、翻译小语种

即便是那种只有2000人左右使用的语言也能搞定,比如将英语翻译成萨特兰语。

dec75ffbd88a440fa0ab119c9c387fbd.gif

除此之外,还有像分析理解论文中表格的细节。

21baa0cb167c38a102f253f976f25be9.png

对于这波实测,网友们都表示惊叹:这是个巨大进步,想说可能得等GPT-5来对抗。

f196da1e371fcd52e7356757035505b3.png
35ab71aaf04e7d4c60aa130b74ccd473.png

尤其是能处理100万Tokens上下文,这对GenAI初创公司很有用。

428d60c265c9c274c1cb12dd0397ea75.png

还有网友好奇谷歌是怎么解决上下文窗口大小问题的?

9e925e7d706ad19b584db9fcb05079df.png

一定是发现或实现了什么新东西。

c6968ea637c616d4565cd1322dcf4ead.jpeg

网友:不太可能是巧合

不过对于谷歌这波“反击”,暂且还未有OpenAI的人出来回应。而此前Sora的发布,也少见有谷歌的人出来评价。

但两家同一天发布,早就有网友浮想联翩:

确实不太可能是巧合

3e68ba2becb9ac844dcf86852e802b94.png

奥特曼不想失去谷歌这样一个绝妙的炒作时机。

68e1d5aeba70c3aa69376cf7658380ea.png

有网友认为,Sora宣布显然是一种营销举措,它还没有准备好。相比而言,Gemini 1.5 才是真正的突破。

477786d200a70ae9aea540a5b2dfe9c9.png

但也有人认为,Sora才真正意想不到。

Gemini 1.5 非常棒,但并不令人惊讶。

我非常有信心 OpenAI 内部也有超过 100 万个模型。(Sora是一个副项目)。

c31a7d085586c9fed9f8285eb212da82.png

并且认为GPT-5出来之后,会击败所有的竞争对手。

c9caa9db2aaa711ec8b90d3e5494d734.png

对于两家这样的操作,你怎么看呢?

One More Thing

两家激战,受伤的是Adobe这类聚光灯之外的玩家。

这两天股价简直是一跌再跌……

而此前备受关注的视频生成公司Runway,其联合创始人回应:游戏开始了

值得一提的是,此次国内反应跟ChatGPT那时候有点不一样。

Sora出来之后,少见喊对标的人,比当时要安静多了…

参考链接:
https://twitter.com/rowancheung/status/1759280384930459941

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值