人工智能-基础篇16篇-国内可商用大模型现状分析

Freedom3568

于 2023-10-17 15:26:01 发布

阅读量199

点赞数

CC 4.0 BY-SA版权

分类专栏：小白都能懂的人工智能：由浅入深探索人工智能的奇妙世界文章标签：人工智能商用大模型分析生态

本文链接：https://blog.youkuaiyun.com/zhanggqianglovec/article/details/133885106

小白都能懂的人工智能：由浅入深探索人工智能的奇妙世界专栏收录该内容

82 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文分析了国内大模型的开源趋势，从Llama 2开源后的行业影响，到各大公司如阿里、百川智能的开源策略。讨论了大模型厂商在开源与闭源之间的选择，指出7B-13B参数规模的开源模型成为合理选择。同时，阐述了开源大模型生态的繁荣，如Meta和阿里云的举措，以及开源如何影响大模型的商业化和技术创新。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这里插入图片描述

文章目录

@[toc]

前言

一、大模型厂商的选择

二、开源大模型生态

三、开源还是闭源的选择

小结

前言

ChatGPT横空出世7个多月后，7月19日，Llama 2宣布开源，并且可直接商用。如今回看，这一天也成为了大模型发展的分水岭。在此之前，全世界开源的大模型不计其数，可只是停留在开发研究层面。“可商业”短短三个字，犹如一颗重磅炸弹引爆了大模型创业圈，引得傅盛连连感叹。自Llama 2后，开源逐渐成为主流趋势。以Llama架构为首，先掀起了一波以其为核心的开源，如Llama 2低成本训练版、Llama 2最强版、微调版等等。截至发稿前，以“LLama 2”为关键词在国外最大的AI开源社区Hugging Face检索模型，有5341条结果；在全世界最大的开源项目托管平台Github上，也有1500个词条。

之后，创业者们的目光从解构、增强Llama 2转向了构建行业专有大模型，于是又掀起了一波Llama 2+司法、Llama 2+医疗等一系列的行业开源大模型。据不完全统计，Llama 2开源后，国内就涌现出了十几个开源行业大模型。国内头部厂商和创业公司纷纷加入开源浪潮中，阿里QWEN-7B开源一个多月下载量破100万，9月25日升级了QWEN-14B；百川智能开源的Baichuan-7B、13B两款开源大模型下载量目前已经突破500万，200多家企业申请部署开源大模型。

与此形成强烈对比的是，Llama 2对一些闭源的大模型厂商造成了致命性的打击。闭源大模型多采用调取API的方式