GPT-4现场被端侧小模型“暴打”,商汤日日新5.0:全面对标GPT-4 Turbo

商汤科技发布了端侧大模型SenseChatLite和大模型SenseNova5.0,SenseChatLite在《街头霸王》游戏和逻辑推理测试中表现出色,SenseNova5.0全面对标GPT-4Turbo,包括自然语言生成、数学能力和多模态生成。此外,办公小浣熊和代码小浣熊在办公和编程场景中展现出强大的处理能力,商汤大模型技术路线备受瞩目。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

金磊 发自 商汤AIDC
量子位 | 公众号 QbitAI

够刺激,GPT-4竟然当众被“揍”了,甚至连还手的机会都没有:

5c2cd87f494574d5cb71bfddde7b67f1.gif

是的,就是在一场《街头霸王》游戏现场PK中,发生了这样的名场面。

而且二者还是不在一个“重量级”的那种:

  • 绿人:由GPT-4操纵

  • 红人:由一个端侧小模型操纵

b8d98a7420d6ac37d3fe3a7418070ad9.gif

那么这位又小又彪悍的选手到底什么来头?

不卖关子,它正是由商汤科技最新发布的日日新端侧大模型——SenseChat Lite(商量轻量版)。

单是在《街头霸王》里的表现,这个小模型就颇有一种“天下武功,唯快不破”的气势:

GPT-4还在想着怎么决策,SenseChat Lite的拳头就已经打上去了。

不仅如此,商汤CEO徐立还在现场加大难度,直接在手机上断网开测

例如离线模式下生成员工请假一周的申请,效果是这样的:

6004422d5f382208dc8468a63931e142.gif
现场原速

(当然,徐立开玩笑表示“假太长了,不批噢~”)

也可以对长段文字做快速总结:

5dac61c6e556bbbd8cda0043163a49ac.gif
现场原速

而之所能够做到如此,是因为SenseChat Lite在同等尺度性能上已经达到了SOTA水平。

更是用“以小博大”的姿势在多项测试中击败了Llama2-7B,甚至是13B。

372dd436ddbfb80705be3c4250801905.png

在速度方面,SenseChat Lite则是采用了端云“联动”的MoE框架,在部分场景中端侧推理占70%,会让推理成本变得更低。

具体而言,对比人眼20字/秒的阅读速度来说,SenseChat Lite在中等性能手机上,可以达到18.3字/秒推理速度。

若是在高端旗舰手机,那么推理速度可以直接飙到78.3字/秒!

但除了文本生成之外,徐立同样在现场还展示了商汤端侧模型的多模态能力。

例如同样是扩图,商汤的端侧大模型在慢半拍启动的情况下,扩了3种不同图片的速度比友商扩1张的速度还快:

4c0d5c26c32c2adf111c7cde96d4db37.gif

演示的同学甚至直接现场拍照,把照片缩小了很多以后再来自由扩图

e02fa168edb6fb932f1eaeb52517ba36.gif

嗯,不得不说,商汤是敢在现场动真格的。

然而,纵观整场活动,端侧大模型也还仅是此次发布会的一隅。

在“大基座”方面,商汤更是把自家的日日新大模型来了个大版本的升级——SenseNova 5.0。并且直接将其定位到了一个新高度:

全面对标GPT-4 Turbo!

a7781c4bae688552f34ba5a7cd7e5b98.gif

那么日日新大模型5.0版本实力到底如何,我们这就来实测一波~

有请,“弱智吧”!

自打大模型火爆以来,“

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值