文章目录
文章目录
前言
ChatGPT横空出世7个多月后,7月19日,Llama 2宣布开源,并且可直接商用。如今回看,这一天也成为了大模型发展的分水岭。在此之前,全世界开源的大模型不计其数,可只是停留在开发研究层面。“可商业”短短三个字,犹如一颗重磅炸弹引爆了大模型创业圈,引得傅盛连连感叹。自Llama 2后,开源逐渐成为主流趋势。以Llama架构为首,先掀起了一波以其为核心的开源,如Llama 2低成本训练版、Llama 2最强版、微调版等等。截至发稿前,以“LLama 2”为关键词在国外最大的AI开源社区Hugging Face检索模型,有5341条结果;在全世界最大的开源项目托管平台Github上,也有1500个词条。
之后,创业者们的目光从解构、增强Llama 2转向了构建行业专有大模型,于是又掀起了一波Llama 2+司法、Llama 2+医疗等一系列的行业开源大模型。据不完全统计,Llama 2开源后,国内就涌现出了十几个开源行业大模型。国内头部厂商和创业公司纷纷加入开源浪潮中,阿里QWEN-7B开源一个多月下载量破100万,9月25日升级了QWEN-14B;百川智能开源的Baichuan-7B、13B两款开源大模型下载量目前已经突破500万,200多家企业申请部署开源大模型。
与此形成强烈对比的是,Llama 2对一些闭源的大模型厂商造成了致命性的打击。闭源大模型多采用调取API的方式