2025-02-11 Github 热点项目 Unsloth:高效微调语言模型的开源利器

Unsloth是个专门用来优化大语言模型(LLMs)训练的工具,像Llama 3.3、Mistral、Phi-4这些热门模型,用它都能训练得又快又省显存。它有好多免费的notebook,你只要把自己的数据集加进去,点“Run All”,就能得到一个超棒的优化后模型,还能导出到各种格式,方便得很。它还支持超长的上下文窗口,像Llama 3.3在80GB GPU上能支持89K的上下文,比Hugging Face+FA2的13x还长,这在处理长文本任务时简直是大杀器!


1. unsloth

  • 今日新增星标:1,809
  • 总星标数:27,551

连续在榜天数:4

主要编程语言:Python

GitHub - unslothai/unsloth: Finetune Llama 3.3, DeepSeek-R1 & Reasoning LLMs 2x faster with 70% less memory! 🦥

Unsloth 是一个专注于高效微调大型语言模型的开源项目,支持 Llama、Mistral、Phi、Gemma 等多种模型。它通过优化内存使用和加速训练过程,能够在相同硬件条件下实现比传统方法快 2 倍的速度,并减少 70% 的内存消耗。Unsloth 使用 OpenAI 的 Triton 语言编写核心内核,并支持 4bit 和 16bit 的 QLoRA/LoRA 微调,同时保持 0% 的精度损失。项目还提供了丰富的预训练模型和免费 Notebook,用户可以轻松进行模型微调和推理。此外,Unsloth 还支持 Windows 和 Linux 平台,兼容多种 NVIDIA GPU。


2. awesome-deepseek-integration

  • 今日新增星标:1,019
  • 总星标数:11,418

GitHub - deepseek-ai/awesome-deepseek-integration

这是一个关于DeepSeek API集成应用的开源项目,旨在将DeepSeek API与多种流行软件无缝整合。项目涵盖了桌面应用、浏览器插件、开发工具、即时通讯插件等多种场景,帮助用户在不同平台上使用DeepSeek的强大功能。通过这个项目,用户可以在Chatbox、ChatGPT-Next-Web、Liubai等应用中轻松接入DeepSeek AI,提升智能交互体验。项目还支持多种语言和平台,方便全球开发者使用和贡献。无论是个人还是企业,都能通过该项目快速实现AI驱动的自动化流程和智能应用。


3. dify

  • 今日新增星标:688
  • 总星标数:65,576

连续在榜天数:5

主要编程语言:TypeScript

GitHub - langgenius/dify: Dify is an open-source LLM app development platform. Dify's intuitive interface combines AI workflow, RAG pipeline, agent capabilities, model management, observability features and more, letting you quickly go from prototype to production.

Dify 是一个开源的 LLM 应用开发平台,提供直观的界面和丰富的功能。它集成了 AI 工作流、RAG 管道、代理能力、模型管理和可观测性等特性,帮助用户快速从原型开发到生产部署。Dify 支持多种模型提供商,包括 GPT、Mistral 和 Llama3 等,并提供即插即用的工具,如文档提取和代理工具。用户可以通过 Docker 快速部署 Dify,并通过其 API 轻松集成到现有业务逻辑中。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值