金磊 发自 商汤AIDC
量子位 | 公众号 QbitAI
够刺激,GPT-4竟然当众被“揍”了,甚至连还手的机会都没有:
是的,就是在一场《街头霸王》游戏现场PK中,发生了这样的名场面。
而且二者还是不在一个“重量级”的那种:
绿人:由GPT-4操纵
红人:由一个端侧小模型操纵
那么这位又小又彪悍的选手到底什么来头?
不卖关子,它正是由商汤科技最新发布的日日新端侧大模型——SenseChat Lite(商量轻量版)。
单是在《街头霸王》里的表现,这个小模型就颇有一种“天下武功,唯快不破”的气势:
GPT-4还在想着怎么决策,SenseChat Lite的拳头就已经打上去了。
不仅如此,商汤CEO徐立还在现场加大难度,直接在手机上断网开测!
例如离线模式下生成员工请假一周的申请,效果是这样的:
△现场原速
(当然,徐立开玩笑表示“假太长了,不批噢~”)
也可以对长段文字做快速总结:
△现场原速
而之所能够做到如此,是因为SenseChat Lite在同等尺度性能上已经达到了SOTA水平。
更是用“以小博大”的姿势在多项测试中击败了Llama2-7B,甚至是13B。
在速度方面,SenseChat Lite则是采用了端云“联动”的MoE框架,在部分场景中端侧推理占70%,会让推理成本变得更低。
具体而言,对比人眼20字/秒的阅读速度来说,SenseChat Lite在中等性能手机上,可以达到18.3字/秒推理速度。
若是在高端旗舰手机,那么推理速度可以直接飙到78.3字/秒!
但除了文本生成之外,徐立同样在现场还展示了商汤端侧模型的多模态能力。
例如同样是扩图,商汤的端侧大模型在慢半拍启动的情况下,扩了3种不同图片的速度比友商扩1张的速度还快:
演示的同学甚至直接现场拍照,把照片缩小了很多以后再来自由扩图:
嗯,不得不说,商汤是敢在现场动真格的。
然而,纵观整场活动,端侧大模型也还仅是此次发布会的一隅。
在“大基座”方面,商汤更是把自家的日日新大模型来了个大版本的升级——SenseNova 5.0。并且直接将其定位到了一个新高度:
全面对标GPT-4 Turbo!
那么日日新大模型5.0版本实力到底如何,我们这就来实测一波~
有请,“弱智吧”!
自打大模型火爆以来,“