2025-02-11 Github 热点项目 Unsloth：高效微调语言模型的开源利器

原创

已于 2025-02-11 22:01:28 修改 · 2k 阅读

26 ·

CC 4.0 BY-SA版权

文章标签：

#github #语言模型 #开源

于 2025-02-11 22:00:37 首次发布

Unsloth是个专门用来优化大语言模型（LLMs）训练的工具，像Llama 3.3、Mistral、Phi-4这些热门模型，用它都能训练得又快又省显存。它有好多免费的notebook，你只要把自己的数据集加进去，点“Run All”，就能得到一个超棒的优化后模型，还能导出到各种格式，方便得很。它还支持超长的上下文窗口，像Llama 3.3在80GB GPU上能支持89K的上下文，比Hugging Face+FA2的13x还长，这在处理长文本任务时简直是大杀器！

1. unsloth

今日新增星标：1,809

总星标数：27,551

连续在榜天数：4

主要编程语言：Python

GitHub - unslothai/unsloth: Finetune Llama 3.3, DeepSeek-R1 & Reasoning LLMs 2x faster with 70% less memory! 🦥

Unsloth 是一个专注于高效微调大型语言模型的开源项目，支持 Llama、Mistral、Phi、Gemma 等多种模型。它通过优化内存使用和加速训练过程，能够在相同硬件条件下实现比传统方法快 2 倍的速度，并减少 70% 的内存消耗。Unsloth 使用 OpenAI 的 Triton 语言编写核心内核，并支持 4bit 和 16bit 的 QLoRA/LoRA 微调，同时保持 0% 的精度损失。项目还提供了丰富的预训练模型和免费 Notebook，用户可以轻松进行模型微调和推理。此外，Unsloth 还支持 Windows 和 Linux 平台，兼容多种 NVIDIA GPU。

2. awesome-deepseek-integration

今日新增星标：1,019

总星标数：11,418

GitHub - deepseek-ai/awesome-deepseek-integration

这是一个关于DeepSeek API集成应用的开源项目，旨在将DeepSeek API与多种流行软件无缝整合。项目涵盖了桌面应用、浏览器插件、开发工具、即时通讯插件等多种场景，帮助用户在不同平台上使用DeepSeek的强大功能。通过这个项目，用户可以在Chatbox、ChatGPT-Next-Web、Liubai等应用中轻松接入DeepSeek AI，提升智能交互体验。项目还支持多种语言和平台，方便全球开发者使用和贡献。无论是个人还是企业，都能通过该项目快速实现AI驱动的自动化流程和智能应用。

3. dify

今日新增星标：688

总星标数：65,576

连续在榜天数：5

主要编程语言：TypeScript

GitHub - langgenius/dify: Dify is an open-source LLM app development platform. Dify's intuitive interface combines AI workflow, RAG pipeline, agent capabilities, model management, observability features and more, letting you quickly go from prototype to production.

Dify 是一个开源的 LLM 应用开发平台，提供直观的界面和丰富的功能。它集成了 AI 工作流、RAG 管道、代理能力、模型管理和可观测性等特性，帮助用户快速从原型开发到生产部署。Dify 支持多种模型提供商，包括 GPT、Mistral 和 Llama3 等，并提供即插即用的工具，如文档提取和代理工具。用户可以通过 Docker 快速部署 Dify，并通过其 API 轻松集成到现有业务逻辑中。