2 月 18 日,阶跃星辰和吉利汽车集团联合宣布,将双方合作的两款 Step 系列多模态大模型向全球开发者开源。这两款模型分别是目前全球范围内参数量最大、性能最好的开源视频生成大模型 Step-Video-T2V以及行业内首个产品级的开源语音交互模型Step-Audio。这不仅是中国继DeepSeek后为AI科技界带来的又一思路启发,也意味着阶跃星辰成为大模型开源世界的又一股中国力量。
先看看这两款开源大模型的实力。Step-Video-T2V 模型参数量达到 300 亿,能直接生成 204 帧、540P 分辨率的高质量视频 。尤其在复杂运动、美感人物、视觉想象力等方面拥有强大的生成能力,语义理解和指令遵循能力也十分突出,这为视频创作者提供了强大助力,能让创意精准落地。
而 Step-Audio 可根据不同场景需求生成情绪、方言、语种、歌声和个性化风格的表达,实现与用户的高质量自然对话,还能高质量复刻音色、进行角色扮演,影视娱乐、社交、游戏等行业都能从中挖掘丰富的应用价值。
多模态“卷王”阶跃星辰首次开源Step系列模型
和此前引爆全球科技界的 DeepSeek一样,阶跃星辰的 Step-Video-T2V 视频生成模型,采用最为宽松的 MIT许可协议,支持免费商用、任意修改和衍生开发,用户可以在跃问APP内体验到这两款模型。据悉,这也是阶跃星辰首次开源其Step系列基座模型。
凭借强大的多模态实力,阶跃星辰已经先后发布了11款多模态大模型,是多模态领域堪称“卷王”的存在。旗下Step系列的多模态模型,更是长期位居国内外各大权威评测集、竞技场等的榜首。
在被誉为“世界上首个不可玩弄的LLM基准测试”LiveBench最新榜单中,阶跃星辰自研的万亿参数语言大模型Step-2,在国产基座大模型中排名第一,成绩直逼OpenAl+的顶尖模型,超越了GPT-4等多个国际主流模型,全球排名仅次于OpenAl和Anthropic+。
此次将Step系列基座模型开源,对AI领域的重要意义不言而喻。
阶跃星辰创始人、CEO姜大昕博士表示,阶跃星辰本次开源一方面是希望分享最新技术成果,给开源社区贡献力量;另一方面,他们也认为多模态模型是实现AGI的必经之路,但目前尚处于早期阶段,希望以开源的举措与社区开发者集思广益,共同拓展模型技术边界,并推动产业落地。
接棒DeepSeek,中国开源势力再添猛将
从DeepSeek重磅开源引爆全球,到阶跃星辰此次联合吉利开源两大国产多模态大模型,AI开源领域的中国势力已在悄然崛起。
近两年,中国的开源势力不断崛起,我们见证了DeepSeek 的火爆激起的业界新一轮激烈竞争,也看到了最强开源多模态大模型为全球开发者带来的更多选择和参考。
未来,开源可能是AI领域不可逆转的趋势,而世界各地的开发者基于开源的模型和技术,可以进一步优化、创新,加速 AI 技术的迭代。另一方面,不断拓展的应用场景也将为全球 AI 技术应用提供新思路和方向,让 AI 在更多领域创造价值。
可以预见,DeepSeek 爆发之后,更多的国内领先开源技术将会兴起,成为 AI 领域中不可忽视的力量,AI技术也将以前所未有的深度和广度,渗透至各行各业,引领着未来的变革。