一文可懂国内外主流AI大模型

一文可懂国内外主流AI大模型

人工智能技术的飞速进步,正在重塑全球商业格局,其影响辐射到各个行业领域。大模型时代,开源与闭源模型不断涌现,大模型为AI领域注入了新的活力,基于开源大模型的应用如雨后春笋般出现,同时也为研究者和开发者提供了更广阔的创新空间。在此,梳理当前国内外主流的大模型,并赋予简单介绍。

DeepSeek生态圈不断扩大

2025年1月20日,DeepSeek正式发布 DeepSeek-R1,并同步开源模型权重。DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。自1月20日DeepSeek发布R1模型,该模型的用户数实现了飞速增长,根据AI产品榜的数据,截至1月末DeepSeek的月活数量达到3370万,迅速成为国内第二位。

自从DeepSeek 发布开源大模型以来,引发众多关注。阿里云、百度智能云等多个平台已经宣布上线DeepSeek大模型;中国移动、电信、联通三家基础电信企业均已全面接入DeepSeek开源大模型;国家超算互联网平台推出“AI生态伙伴加速计划”,提供3个月DeepSeek API接口免费使用、千万卡时算力资源池等激励;部分微信用户发现,微信搜索已经上线“AI搜索”功能,并接入DeepSeek-R1提供的“深度思考”服务。

海外方面,亚马逊AWS、微软Azure、英伟达等全球多家科技厂商陆续宣布接入DeepSeek模型;AMD、Intel等国际芯片巨头也均选择与DeepSeek合作。

阿里云推出Qwen2.5-Max,开发者可免费体验

Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新探索成果,预训练数据超过20万亿tokens。新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。开发者可在Qwen Chat平台免费体验模型,企业和机构也可通过阿里云百炼平台直接调用新模型API服务。

三方基准测试平台Chatbot Arena盲测发现:阿里Qwen2.5-Max在多领域表现强劲,数学及编程能力斩获第一。

马斯克:发布“地球上最聪明的AI”

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

暗涧幽火

您的鼓励将是我创作的最大动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值