GPT-4现场被端侧小模型“暴打”，商汤日日新5.0：全面对标GPT-4 Turbo

原创

于 2024-04-25 16:48:43 发布 · 578 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

金磊发自商汤AIDC
量子位 | 公众号 QbitAI

够刺激，GPT-4竟然当众被“揍”了，甚至连还手的机会都没有：

是的，就是在一场《街头霸王》游戏现场PK中，发生了这样的名场面。

而且二者还是不在一个“重量级”的那种：

绿人：由GPT-4操纵
红人：由一个端侧小模型操纵

那么这位又小又彪悍的选手到底什么来头？

不卖关子，它正是由商汤科技最新发布的日日新端侧大模型——SenseChat Lite（商量轻量版）。

单是在《街头霸王》里的表现，这个小模型就颇有一种“天下武功，唯快不破”的气势：

GPT-4还在想着怎么决策，SenseChat Lite的拳头就已经打上去了。

不仅如此，商汤CEO徐立还在现场加大难度，直接在手机上断网开测！

例如离线模式下生成员工请假一周的申请，效果是这样的：

△现场原速

（当然，徐立开玩笑表示“假太长了，不批噢~”）

也可以对长段文字做快速总结：

△现场原速

而之所能够做到如此，是因为SenseChat Lite在同等尺度性能上已经达到了SOTA水平。

更是用“以小博大”的姿势在多项测试中击败了Llama2-7B，甚至是13B。

在速度方面，SenseChat Lite则是采用了端云“联动”的MoE框架，在部分场景中端侧推理占70%，会让推理成本变得更低。

具体而言，对比人眼20字/秒的阅读速度来说，SenseChat Lite在中等性能手机上，可以达到18.3字/秒推理速度。

若是在高端旗舰手机，那么推理速度可以直接飙到78.3字/秒！

但除了文本生成之外，徐立同样在现场还展示了商汤端侧模型的多模态能力。

例如同样是扩图，商汤的端侧大模型在慢半拍启动的情况下，扩了3种不同图片的速度比友商扩1张的速度还快：

演示的同学甚至直接现场拍照，把照片缩小了很多以后再来自由扩图：

嗯，不得不说，商汤是敢在现场动真格的。

然而，纵观整场活动，端侧大模型也还仅是此次发布会的一隅。

在“大基座”方面，商汤更是把自家的日日新大模型来了个大版本的升级——SenseNova 5.0。并且直接将其定位到了一个新高度：

全面对标GPT-4 Turbo！

那么日日新大模型5.0版本实力到底如何，我们这就来实测一波~

有请，“弱智吧”！

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。