人工智能-基础篇18篇-国内外大模型盘点（一）_国内外大模型对比-优快云博客

本文链接：https://blog.youkuaiyun.com/zhanggqianglovec/article/details/133887156

本文盘点了多个开源大语言模型，包括Meta的LLaMA、斯坦福大学的Alpaca、Databricks的Dolly2.0、Hugging Face的BLOOM等，这些模型在性能、成本和易用性上各有优势，展示了开源生态在AI领域的繁荣景象。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这里插入图片描述

文章目录

@[toc]

前言

一、Meta：LLaMA，生态发展蓬勃

二、斯坦福大学：Alpaca，性价比拉满

三、Databricks：Dolly2.0，全开源可商用

四、Hugging Face：BLOOM，体量惊人

五、阿卜杜拉国王科技大学MiniGPT4，图像对话能力可观

六、Stability AIStableLM，万亿token训练

七、元语智能ChatYuan，首个中文开源对话模型

八、清华大学ChatGLM，开辟小而精方向

九、昆仑万维天工系列模型，新模型实现智能涌现

十、大模型时代：开源vs闭源

前言

作为如今LLM圈内绝对的领头羊，OpenAI并没有遵从其创立初衷，无论是ChatGPT早期所使用的的GPT3、GPT3.5还是此后推出的GPT4模型，OpenAI都因“暂无法保证其不被滥用”为由拒绝了对模型开源，开启了订阅付费模式。对于大型科技企业而言，不管是出于秀肌肉还是出于商业竞争目的，自研LLM都是一条几乎无可避免的道路。但对于缺少算力和资金的中小企业以及希望基于LLM开发衍生产品的开发者来说，选择开源显然是更理想的一条路线。

一、Meta：LLaMA，生态发展蓬勃

项目地址：github.com/facebookresearch/llama

注意上面这个项目地址是llama的推理代码,不是训练代,里面的模型下载可以直接在百度搜一下,不用按照meta的方式下载,太慢了,这里提供一个模型下载地址https://openai.wiki/llama-model-download.html 。几周前，MetaAI推出了大语言模型LLaMA，其不同版本包括70亿、130亿、330亿和650亿的参数，虽然比GPT3还小，但LLaMA在许多任务上的性能都能够追平甚至超越GPT3。像我的3090的卡,最多智能运行70亿参数的模型,占用17g的显存,整体模型占用25G磁盘空间。更值得注意