一文可懂国内外主流AI大模型

最新推荐文章于 2025-11-03 19:40:42 发布

原创

最新推荐文章于 2025-11-03 19:40:42 发布 · 1.2k 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#ai #语言模型 #职场和发展

一文可懂国内外主流AI大模型

人工智能技术的飞速进步，正在重塑全球商业格局，其影响辐射到各个行业领域。大模型时代，开源与闭源模型不断涌现，大模型为AI领域注入了新的活力，基于开源大模型的应用如雨后春笋般出现，同时也为研究者和开发者提供了更广阔的创新空间。在此，梳理当前国内外主流的大模型，并赋予简单介绍。

DeepSeek生态圈不断扩大

2025年1月20日，DeepSeek正式发布 DeepSeek-R1，并同步开源模型权重。DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。自1月20日DeepSeek发布R1模型，该模型的用户数实现了飞速增长，根据AI产品榜的数据，截至1月末DeepSeek的月活数量达到3370万，迅速成为国内第二位。

自从DeepSeek 发布开源大模型以来，引发众多关注。阿里云、百度智能云等多个平台已经宣布上线DeepSeek大模型；中国移动、电信、联通三家基础电信企业均已全面接入DeepSeek开源大模型；国家超算互联网平台推出“AI生态伙伴加速计划”，提供3个月DeepSeek API接口免费使用、千万卡时算力资源池等激励；部分微信用户发现，微信搜索已经上线“AI搜索”功能，并接入DeepSeek-R1提供的“深度思考”服务。

海外方面，亚马逊AWS、微软Azure、英伟达等全球多家科技厂商陆续宣布接入DeepSeek模型；AMD、Intel等国际芯片巨头也均选择与DeepSeek合作。

阿里云推出Qwen2.5-Max，开发者可免费体验

Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新探索成果，预训练数据超过20万亿tokens。新模型展现出极强劲的综合性能，在多项公开主流模型评测基准上录得高分，全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。开发者可在Qwen Chat平台免费体验模型，企业和机构也可通过阿里云百炼平台直接调用新模型API服务。

三方基准测试平台Chatbot Arena盲测发现：阿里Qwen2.5-Max在多领域表现强劲，数学及编程能力斩获第一。