开源大模型清单(精选100个)
模型名称 | 类别 | 说明 |
---|---|---|
deepseek-ai/DeepSeek-R1 | Text Generation | 通用文本生成,支持长文本与代码生成 |
black-forest-labs/FLUX.1-dev | Text-to-Image | 高分辨率文本生成图像,擅长艺术风格渲染 |
CompVis/stable-diffusion-v1-4 | Text-to-Image | 经典文生图模型,支持多样化风格生成 |
stabilityai/stable-diffusion-xl-base-1.0 | Text-to-Image | 升级版SDXL模型,图像细节更丰富 |
meta-llama/Meta-Llama-3-8B | Text Generation | 轻量级多语言文本生成,适合对话与推理 |
bigscience/bloom | Text Generation | 多语言大模型,支持176种语言文本生成 |
stabilityai/stable-diffusion-3-medium | Text-to-Image | 动态光影处理优化,适合3D场景生成 |
mistralai/Mixtral-8x7B-Instruct-v0.1 | Text Generation | 混合专家模型(MoE),擅长复杂指令理解 |
meta-llama/Llama-2-7b | Text Generation | 基础版Llama 2,通用文本生成 |
openai/whisper-large-v3 | Automatic Speech Recognition | 多语言语音转文本,支持99种语言 |
stabilityai/stable-diffusion-2-1 | Text-to-Image | 改进版图像生成,分辨率与稳定性提升 |
meta-llama/Meta-Llama-3-8B-Instruct | Text Generation | 指令优化版,适合任务导向对话 |
WarriorMama777/OrangeMixs | Text-to-Image | 动漫风格图像生成,支持色彩增强 |
lllyasviel/ControlNet-v1-1 | Image Control | 图像生成控制工具(如姿势/边缘引导) |
lllyasviel/ControlNet | Image Control | 原始版ControlNet,精准控制图像生成过程 |
mistralai/Mistral-7B-v0.1 | Text Generation | 高效小模型,适合低资源设备部署 |
deepseek-ai/DeepSeek-V3 | Text Generation | 中文优化模型,擅长逻辑推理与代码生成 |
microsoft/phi-2 | Text Generation | 小型语言模型,数学与逻辑能力突出 |
hexgrad/Kokoro-82M | Text-to-Speech | 轻量级语音合成,支持情感语调调节 |
google/gemma-7b | Text Generation | 谷歌轻量级模型,适合安全敏感场景 |
prompthero/openjourney | Text-to-Image | 艺术风格生成,模拟油画/水彩效果 |
sentence-transformers/all-MiniLM-L6-v2 | Sentence Similarity | 文本嵌入模型,用于语义相似度计算 |
deepseek-ai/Janus-Pro-7B | Any-to-Any | 多模态模型,支持文本/图像/音频跨模态处理 |
stabilityai/stable-video-diffusion-img2vid-xt | Image-to-Video | 图像转视频,支持动态效果生成 |
THUDM/chatglm-6b | Text Generation | 中文对话模型,支持本地化部署 |
mistralai/Mistral-7B-Instruct-v0.2 | Text Generation | 指令优化版,适合客服与教育场景 |
openai-community/gpt2 | Text Generation | 经典GPT-2模型,开源文本生成基准 |
tiiuae/falcon-40b | Text Generation | 高性能多语言模型,支持长文本生成 |
hakurei/waifu-diffusion | Text-to-Image | 二次元动漫风格生成,适合角色设计 |
coqui/XTTS-v2 | Text-to-Speech | 多语言语音合成,支持跨语言音色迁移 |
stabilityai/sdxl-turbo | Text-to-Image | 快速文生图模型,实时生成低分辨率图像 |
xai-org/grok-1 | Text Generation | 幽默对话生成,侧重拟人化交互 |
meta-llama/Llama-2-70b-chat-hf | Text Generation | 大规模对话模型,适合复杂场景推理 |
google-bert/bert-base-uncased | Fill-Mask | 经典BERT模型,用于文本分类与信息抽取 |
THUDM/chatglm2-6b | Text Generation | 升级版中文对话模型,支持长上下文理解 |
ByteDance/SDXL-Lightning | Text-to-Image | 闪电级图像生成,速度优化版SDXL |
openai/whisper-large-v3-turbo | Automatic Speech Recognition | 增强版语音识别,抗噪能力提升 |
meta-llama/Llama-3.3-70B-Instruct | Text Generation | 大规模指令模型,企业级任务处理 |
stabilityai/stable-diffusion-xl-refiner-1.0 | Image-to-Image | 图像优化工具,提升细节与画质 |
BAAI/bge-m3 | Sentence Similarity | 多语言文本嵌入,支持密集/稀疏检索 |
openai/whisper-large-v2 | Automatic Speech Recognition | 高精度语音转文本,支持多语言转录 |
HuggingFaceH4/zephyr-7b-beta | Text Generation | 对齐优化模型,符合人类价值观输出 |
microsoft/Phi-3-mini-128k-instruct | Text Generation | 超长上下文支持(128k tokens),适合文档分析 |
Qwen/QwQ-32B-Preview | Text Generation | 通义千问开源版本,中文优化 |
tencent/HunyuanVideo | Text-to-Video | 腾讯文生视频模型,支持多镜头控制 |
meta-llama/Llama-3.2-1B | Text Generation | 轻量级模型,适合移动端部署 |
EleutherAI/gpt-j-6b | Text Generation | 开源GPT-3替代方案,支持代码生成 |
apple/OpenELM | Text Generation | 苹果开源模型,专注设备端效率优化 |
stabilityai/stable-cascade | Text-to-Image | 分层式图像生成,分阶段优化画质 |
Salesforce/blip-image-captioning-large | Image-to-Text | 图像描述生成,支持多模态问答 |
suno/bark | Text-to-Speech | 高度拟人化语音合成,支持笑声/语气词 |
完整表格说明
- 类别分类:涵盖文本生成、图像生成、语音处理、多模态等主流领域;
- 功能聚焦:标注模型核心优势(如中文优化、速度特化、艺术风格等);
- 开源协议:所有模型均可在GitHub/Hugging Face等平台获取;
- 扩展阅读:访问模型官网查看具体部署教程与API文档。