Unsloth是个专门用来优化大语言模型(LLMs)训练的工具,像Llama 3.3、Mistral、Phi-4这些热门模型,用它都能训练得又快又省显存。它有好多免费的notebook,你只要把自己的数据集加进去,点“Run All”,就能得到一个超棒的优化后模型,还能导出到各种格式,方便得很。它还支持超长的上下文窗口,像Llama 3.3在80GB GPU上能支持89K的上下文,比Hugging Face+FA2的13x还长,这在处理长文本任务时简直是大杀器!
1. unsloth
- 今日新增星标:1,809
- 总星标数:27,551
连续在榜天数:4
主要编程语言:Python
Unsloth 是一个专注于高效微调大型语言模型的开源项目,支持 Llama、Mistral、Phi、Gemma 等多种模型。它通过优化内存使用和加速训练过程,能够在相同硬件条件下实现比传统方法快 2 倍的速度,并减少 70% 的内存消耗。Unsloth 使用 OpenAI 的 Triton 语言编写核心内核,并支持 4bit 和 16bit 的 QLoRA/LoRA 微调,同时保持 0% 的精度损失。项目还提供了丰富的预训练模型和免费 Notebook,用户可以轻松进行模型微调和推理。此外,Unsloth 还支持 Windows 和 Linux 平台,兼容多种 NVIDIA GPU。
2. awesome-deepseek-integration
- 今日新增星标:1,019
- 总星标数:11,418
GitHub - deepseek-ai/awesome-deepseek-integration
这是一个关于DeepSeek API集成应用的开源项目,旨在将DeepSeek API与多种流行软件无缝整合。项目涵盖了桌面应用、浏览器插件、开发工具、即时通讯插件等多种场景,帮助用户在不同平台上使用DeepSeek的强大功能。通过这个项目,用户可以在Chatbox、ChatGPT-Next-Web、Liubai等应用中轻松接入DeepSeek AI,提升智能交互体验。项目还支持多种语言和平台,方便全球开发者使用和贡献。无论是个人还是企业,都能通过该项目快速实现AI驱动的自动化流程和智能应用。
3. dify
- 今日新增星标:688
- 总星标数:65,576
连续在榜天数:5
主要编程语言:TypeScript
Dify 是一个开源的 LLM 应用开发平台,提供直观的界面和丰富的功能。它集成了 AI 工作流、RAG 管道、代理能力、模型管理和可观测性等特性,帮助用户快速从原型开发到生产部署。Dify 支持多种模型提供商,包括 GPT、Mistral 和 Llama3 等,并提供即插即用的工具,如文档提取和代理工具。用户可以通过 Docker 快速部署 Dify,并通过其 API 轻松集成到现有业务逻辑中。





最低0.47元/天 解锁文章
914

被折叠的 条评论
为什么被折叠?



