阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

部署运行你感兴趣的模型镜像
西风 梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

昨晚,杭州大模型又双叒不睡,给大伙儿 拜 年 啦~

就在春晚直播进行时,里通义Qwen发布新春节礼第三弹

Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡DeepSeek V3。

3d3bd705c28669f4c56a6d4f27787f6a.png

Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准统统拿下,Qwen2.5-Max整体表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o,和Claude-3.5-Sonnet也能比一比。

34056e76b564737647e507bd51e2f2be.png

基座模型对比中,Qwen2.5-Max同样超越DeepSeek V3、Llama-3.1-405B,在针对模型知识理解和推理能力的MMLU-Pro等基准上均表现不凡。

c391784b9a10123495ba8c7f9975cab8.png

更令AI社区关注的是,Qwen2.5-Max同DeepSeek V3一样是超大规模的MoE模型,经超20万亿token的预训练数据及精心设计SFT+RLHF后训练方案训练而成。

43ff42662abba7217948ddb361f001d1.png

Qwen2.5-Max这份春节礼包被网友们齐刷刷收入囊中。前有DeepSeek,还有阿里通义Qwen,网友们不忘艾特奥特曼:

祝大家新年快乐,特别祝Sam。

69b4eeb0a0e4a13cef84595f37603e38.png

阿里研究员在模型发布后也都还不睡,纷纷当起了自个儿的自来水。

阿里高级算法专家林俊旸开麦:

Qwen2.5-Max在基准测试中表现良好,希望大家可以试试看,新年快乐!

fc779bc29e2dfe33acf1b1223a8da3fe.png

之前曾自曝阿里大模型员工996作息表的Binyuan Hui也再次现身:

外面的烟花照亮了天空,我却坐在电脑跟前。

037e81e5a84c37e3b17bfd16638aa886.png

多模态能力展示

下面是Qwen2.5-Max在四个使用场景上的演示。

首先是联网搜索功能,输出的每句话来源出处都有标注,整体运行也很丝滑。

42e2e671f19ec0f0c9541c13e120b9b1.gif

代码能力上,Qwen2.5-Max能够帮助用户完成各种可视化创作,一句话就能做出下面这样旋转的球体:

6095ad95d1fac48db10ae163547f7b4a.gif

有网友改造了一下,让球体内部有三个弹跳的黄色小球。

9c8ba0b4693b307af47638c6be178640.png

结果只尝试了一次就成功了,而且三个小球始终在大球内部运动,能正确处理碰撞:

23d9f5c0996c4771869ca7718093b032.gif

Qwen2.5-Max也有Artifacts功能,同样一句话,能开发各种小应用、小游戏。

比如制作一个扫雷小游戏,秒秒钟“啪”一下直接就能玩:

bdd62301318e373cbdecc15072900a76.gif

另外Qwen2.5-Max数单词中的特定字母数量也不在话下。

4831b7bc240a3ba2ba91e7b8dd6ed3e0.gif

现在,Qwen2.5-Max已在Qwen Chat中上线。

此外也有Hugging Face的Demo可玩,还上线了Any Chat,并且可通过阿里云服务使用API。

75749fb9f8c097f1b5c905982fe38c6a.png

感兴趣的童鞋赶紧试试吧~

参考链接:
[1]https://qwenlm.github.io/blog/qwen2.5-max/
[2]https://x.com/JustinLin610/status/1884263803451498794
[3]https://x.com/_akhaliq/status/1884278071093502253
[4]https://x.com/huybery/status/1884263539675934860

您可能感兴趣的与本文相关的镜像

Yolo-v8.3

Yolo-v8.3

Yolo

YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出,因其高速和高精度而广受欢迎

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值