曦紫沐-优快云博客

原创 LoRA rank 怎么选？r=8 和 r=64 差别到底有多大？

在使用 LoRA 微调大模型时，rank（r）几乎是最重要、也最容易被随意设置的超参数。r=8r=16，也有人一味追求“大力出奇迹”直接上r=64。LoRA 的 rank 到底在控制什么？r=8 和 r=64 的本质差别是什么？又该如何在实际工程中选择？本文将从原理、效果、显存与工程经验多个角度，帮你一次讲清楚。rank 决定了 LoRA 的“上限”，但性能更多取决于任务和数据。默认 r=8 或 16验证驱动，而非拍脑袋rank 大≠效果一定好#LoRA#参数高效微调#大模型训练。

2026-01-09 15:59:33 387

原创 LoRA、Adapter、Prefix Tuning 有什么本质区别？一文彻底讲清 PEFT 三大方案

摘要本文系统对比了大模型微调中的三种高效参数微调方法（PEFT）：LoRA、Adapter和Prefix Tuning。LoRA通过在权重空间中学习低秩增量实现微调，Adapter通过插入可训练子网络扩展结构，Prefix Tuning则通过操控注意力层的上下文记忆来引导模型。三者各具特点：LoRA参数少、兼容性好，Adapter表达能力更强，Prefix Tuning对原模型侵入性最低。

2026-01-09 15:43:29 683

原创 LoRA 为什么能缓解灾难性遗忘？从原理到大模型微调实战

在大模型微调中，“灾难性遗忘”几乎是绕不开的问题。为了解决这一痛点，成为了当前最主流、最有效的参数高效微调（PEFT）方案之一。本文将从灾难性遗忘的本质出发，深入解析 LoRA 的核心原理，并结合大模型微调实践，解释LoRA 为什么天生就能缓解灾难性遗忘，以及在实际工程中应如何正确使用。LoRA 之所以能缓解灾难性遗忘，并不是“训练技巧”，而是“结构设计上的优势”。不去改写记忆，而是为新知识单独开一块空间。这正是 LoRA 能成为大模型微调事实标准的重要原因。如果你对。

2026-01-09 15:15:14 525

原创模型微调必踩的坑：什么是灾难性遗忘？如何有效避免？

灾难性遗忘（Catastrophic Forgetting）是深度学习模型微调时的常见问题，表现为新任务性能提升但旧任务能力急剧下降。

2026-01-09 14:59:25 436

原创一文搞懂模型训练中的「过拟合」与「欠拟合」：原因分析与实战解决方案

在模型训练和微调（Fine-tuning）过程中，过拟合和欠拟合是几乎每个算法工程师都会遇到的问题。欠拟合意味着模型“学不会”，而过拟合则意味着模型“学过头”。本文将从概念、成因以及解决方法三个层面，系统讲解什么是过拟合与欠拟合，并结合深度学习与大模型微调的实际场景，总结一套实用的排查与优化思路，帮助你在训练过程中少走弯路。

2026-01-09 14:20:18 196

原创一文搞懂 Python 多线程与多进程：从原理到选型实战

本文系统讲解Python中多线程与多进程的核心区别与应用场景。多线程受GIL限制，适合I/O密集型任务，共享内存但无法充分利用多核CPU；多进程则适合CPU密集型任务，能真正并行执行但创建成本高。文章通过示例代码展示两种方式的实现，并给出清晰的选型建议：I/O密集用多线程，CPU密集用多进程，同时推荐了更进阶的并发处理方案。

2026-01-09 11:14:19 627

原创 KV Cache Offloading 到 CPU / NVMe，显存到底能省多少？一篇算清楚

本文定量分析了KV Cache Offloading技术在大模型推理中的显存优化效果。KV Cache在长上下文场景下会占用大量显存，通过将其部分卸载到CPU或NVMe可节省70%-95%的显存，但会带来带宽瓶颈、延迟增加和工程复杂度等代价。最适合用于显存紧张、长上下文、高并发的场景，结合INT8量化可进一步优化。该技术本质是以带宽和延迟换取显存容量，需要根据实际需求权衡使用。

2026-01-08 18:42:24 401

原创 KV Cache 量化后显存能省多少？一算就清楚的工程账本

摘要 KV Cache量化是当前大模型推理中优化显存占用的关键技术。分析表明，将KV Cache从FP16量化为INT8可减少50%显存，INT4则可减少75%。以LLaMA-7B为例，8k上下文下FP16需4GB显存，而INT8仅需2GB，INT4仅1GB。在高并发场景中，这种线性放大的显存节省直接影响系统吞吐量。工程实践显示INT8对模型效果几乎无影响，推荐优先采用；INT4需谨慎评估。主流框架如vLLM、TensorRT-LLM已支持INT8，使KV Cache量化成为性价比最高的推理优化手段之一，特

2026-01-08 15:32:33 257

原创一文算清 vLLM PagedAttention 的显存占用：KV Cache 到底吃多少显存？

本文详细分析了vLLM中PagedAttention的显存占用计算方法。文章指出PagedAttention并未改变KV Cache的单位token显存成本，而是优化了显存分配方式和利用效率。通过推导单token和单Block的显存计算公式，说明其核心优势在于仅对实际使用的token付费，而非预分配最大长度。文章还比较了传统KV Cache与PagedAttention的显存差异，讨论了Block Size的影响，并提供了快速估算显存的工程公式。最终强调PagedAttention实现了操作系统级别的精细化

2026-01-08 15:10:09 416

原创彻底搞懂 vLLM 的 PagedAttention：KV Cache 不再爆显存的秘密

vLLM通过创新的PagedAttention机制解决了大语言模型推理中的KV Cache管理难题。该技术借鉴操作系统分页思想，将KV Cache划分为固定大小的Block进行动态管理，实现了显存的高效利用。相比传统连续分配方式，PagedAttention显著降低了显存碎片，提升了并发处理能力，尤其适合长上下文和动态变化的服务场景。其核心在于解耦逻辑序列与物理存储，通过Block Table实现非连续KV Cache的高效访问。这一技术突破使大模型推理具备了操作系统级别的内存管理能力，成为vLLM高性能的

2026-01-08 14:49:07 330

原创一文读懂 KV Cache：大模型推理速度暴涨的秘密武器

KV Cache是大语言模型推理优化的关键技术，它通过缓存历史token的注意力Key和Value，避免重复计算，显著提升推理速度。Transformer架构的自回归生成过程中，KV Cache将计算复杂度从O(n²)降至O(n)，成为业界标配。虽然会占用显存，但其性能优势明显，支持流式输出和多轮对话。优化方案包括PagedAttention、量化压缩等。理解KV Cache原理对模型部署和推理优化至关重要，是大模型高性能生成的基础设施。

2026-01-08 14:17:51 471

原创 PPO vs DPO：大模型对齐的两种核心方法，谁才是未来？

在让大语言模型与人类价值观对齐的道路上，PPO和DPO代表了两种截然不同的技术路线。本文将深入剖析这两种主流方法的本质区别、实现原理与实战优劣，帮你彻底搞懂这个让无数AI工程师头疼的核心问题。

2026-01-08 11:31:56 564

原创别再混淆了！三分钟用“医生看病”比喻讲清：交叉熵损失 vs 微调损失函数

摘要：本文通过“医生看病”的比喻，清晰区分了交叉熵损失与微调损失函数的核心差异。交叉熵如同血压计读数，是客观、固定的测量工具，仅评估预测误差；而微调损失函数则像综合健康计划，是主观设计的优化方案，融合多项目标（如准确率、泛化性）。前者是通用度量标准（如计算分类误差），后者是任务定制的策略（如加权组合正则化项）。理解二者“工具”与“方案”的本质关系（交叉熵常作为微调损失的核心组件），是进阶模型优化的关键。全文通过流程图、实例和对比表格，帮助读者建立系统认知。

2026-01-07 18:51:58 753

原创不再迷惑！交叉熵损失和微调的关系，一张图给你讲明白

本文通过生活化比喻阐明了交叉熵损失与模型微调的关系：交叉熵如同裁判的评分规则，仅负责计算预测与标准答案的差距；而微调则是包含训练数据准备、预测、损失计算和参数调整的完整教学过程。二者本质不同但相辅相成，交叉熵是微调过程中的关键评估工具。文章强调技术概念可通过具体场景类比来理解，并指出虽然微调可采用不同损失函数，但交叉熵在分类和生成任务中效果最佳。全文以"完形填空"为例，清晰展示了从模型预测到参数优化的完整闭环流程。

2026-01-07 18:39:19 468

原创一行命令踩坑？Step-Audio-EditX 中 Git LFS 报错的完整解决方案

Git LFS缺失导致Step-Audio-EditX项目无法拉取模型权重的解决方案。当执行git lfs install时出现git: 'lfs' is not a git command错误，表明系统未安装Git LFS扩展。在Ubuntu下只需三步：1) sudo apt install git-lfs安装工具；2) git lfs install初始化；3) git lfs pull拉取真实模型文件而非指针。若已错误克隆，建议删除后重新克隆仓库。该问题在涉及大模型文件的项目中常见，提前安装Git L

2026-01-06 15:18:59 225

原创极速蒸馏实践：基于 Unsloth 与 LoRA 技术蒸馏 DeepSeek-R1-Distill-Qwen-1.5B 模型

摘要本文介绍了使用Unsloth和LoRA技术对DeepSeek-R1-Distill-Qwen-1.5B模型进行高效知识蒸馏的方法。通过结合Unsloth的优化训练和LoRA的低秩适配，实现了3-5倍速度提升和70%显存节省。内容涵盖环境配置、模型加载、蒸馏训练全流程，并提供了预训练模型推理测试示例。该方法为资源受限场景下的模型轻量化提供了有效解决方案。

2025-12-31 15:41:40 948

原创训练速度飙升5倍！Unsloth动态量化让大模型微调告别“卡脖子”

Unsloth 是一个革命性的大型语言模型（LLM）高效微调框架。它通过独家手动推导并编写的GPU内核，在不改变硬件的前提下，实现了训练速度的2-5倍提升，同时显存占用最高可减少80%**。其核心的动态量化（Dynamic 2.0）技术，能在几乎不损失模型性能的情况下（如Qwen3模型性能损失<1%），将模型压缩至极小的体积，极大地降低了个人开发者和研究者的硬件门槛。

2025-12-18 16:35:42 539

原创一站式大模型微调与部署利器：ms-SWIFT 全面解析

ms-SWIFT是ModelScope推出的高效大模型微调与部署框架，支持450+大语言模型和150+多模态模型的全流程处理。该框架提供LoRA、QLoRA等多样化微调策略，显著降低计算成本，并支持分布式训练与推理加速。其特色包括多模态任务覆盖、用户友好界面，以及适用于不同算力场景的优化方案，是科研和商业落地的理想工具。

2025-12-18 16:12:55 1105

原创 LLaMA-Factory：一站式大模型微调神器，轻松打造专属AI！

摘要 LLaMA-Factory是一个开源的大模型微调框架，支持100+主流LLM/VLM模型的高效微调。它集成了LoRA、QLoRA等先进微调技术，显著降低计算资源需求，并提供从训练监控到部署的全流程解决方案。框架支持多模态任务处理，内置可视化工具和多种部署方式，大幅降低大模型应用门槛。通过简洁的三步操作，用户即可完成模型微调，适用于学术研究、产业落地等多种场景。

2025-12-18 15:48:17 1235

原创轻量却强大：Fun-ASR-Nano-2512 语音识别模型上手指南

Fun-ASR-Nano-2512是FunASR开源生态中的轻量级语音识别模型，主打小体积、低延迟和易部署。该模型在保证识别效果的前提下优化结构，适合资源受限环境，可应用于语音指令、智能客服等场景。文章介绍了模型定位、核心优势，并提供了Python环境下的快速使用示例，帮助开发者快速集成语音识别能力。该模型强调效率与易用性，是语音应用落地的理想选择。

2025-12-16 17:41:12 1706 3

原创 Fun-CosyVoice 3.0：新一代LLM语音合成模型深度解析

Fun-CosyVoice 3.0是一款基于大语言模型的零样本多语言语音合成系统，在0.5B参数量下实现了卓越性能。它支持9种语言和18+种中文方言，具备跨语言语音克隆能力，音色相似度达78%（中文测试集）。创新功能包括发音修补、智能化文本正则化和150ms低延迟流式处理。通过强化学习优化，内容准确率（中文CER）提升至0.81%，超越多个更大参数模型。适用于多语言内容创作、实时交互系统等场景，代表了开源语音合成技术的重要突破。

2025-12-16 16:59:15 1384

原创告别重复代码！Qoder：AI 智能编程助手，我的开发效率翻倍秘密武器

摘要：本文介绍AI编程助手Qoder的核心功能，包括智能代码生成、跨语言转换和交互式调试。通过实际案例展示其如何提升开发效率，如快速生成JSON处理函数和诊断API问题。文章提供使用技巧（明确需求、分步执行）和适用场景（原型开发、代码迁移），并分享专属邀请码获取额外福利。Qoder能显著减少重复编码工作，让开发者更专注核心逻辑，是提升生产力的理想工具。（150字）

2025-12-15 11:21:49 525

原创 GPT-5.2震撼发布：三档模型精准出击，性能全面革新！

一场由谷歌Gemini 3引发的AI军备竞赛，促使OpenAI启动“红色警报”，在短短一个月内完成了从GPT-5.1到GPT-5.2的跨越式升级。北京时间12月11日，OpenAI正式发布了GPT-5的最新升级版本GPT-5.2。这一版本在通用智能、长文本处理、智能体工具调用和视觉理解等方面得到显著提升。令人瞩目的是，GPT-5.2被拆分为Instant、Thinking和Pro三个针对性版本，覆盖从日常查询到专业级任务的全方位需求。

2025-12-12 14:12:11 969

原创智谱AI开源GLM-TTS：零样本语音克隆+强化学习，让AI说话更有感情！

GLM-TTS是智谱AI最新开源的基于大语言模型的文本到语音合成系统，支持零样本语音克隆和流式推理。该系统采用创新的两阶段架构，结合多奖励强化学习框架，不仅能够实现高质量的语音合成，更能生成富有情感表达的自然语音。本文将深入解析GLM-TTS的技术架构、核心特性以及实际应用场景。2025年12月11日，智谱AI正式开源了GLM-TTS项目，这是一个基于大型语言模型的高质量文本到语音合成系统。与传统TTS系统相比，GLM-TTS在语音质量、情感表达和发音控制方面都有显著提升。

2025-12-12 14:01:26 1052

原创炸裂！智谱AI开源GLM-4.6V多模态大模型，能看能想还能执行，本地部署9B轻量版来了！

智谱AI开源多模态大模型GLM-4.6V系列，包含106B参数的云端高性能版和9B参数的轻量本地版。新模型支持128K tokens上下文窗口，原生集成Function Calling能力，可理解图像并执行复杂任务。GLM-4.6V-Flash轻量版特别适合个人开发者和边缘设备部署。用户可通过ModelScope平台免费体验该模型，探索智能客服、AI编程等应用场景。

2025-12-09 16:46:02 1144

原创 uv venv --seed：你绝对不该忽略的虚拟环境“安全开关”

本文解析了uv venv命令中--seed参数的作用，它决定了虚拟环境创建时是否预装pip、setuptools和wheel这三个核心工具。使用--seed能确保兼容性，避免依赖安装失败，适合大多数项目开发；而默认的--no-seed模式则创建极简环境，适合特殊需求场景。这一设计体现了uv工具在性能与兼容性间的平衡，建议开发者根据实际需求选择使用该参数，以构建更可靠的Python开发环境。

2025-12-09 11:33:22 703

原创 uv venv VS uv init：一招分清Python虚拟环境与项目初始化！

摘要本文解析了 uv 包管理器中 uv venv 和 uv init 的核心区别： uv venv：仅创建纯净虚拟环境，适用于临时测试或升级现有项目的Python版本。 uv init：一站式初始化新项目，生成虚拟环境、pyproject.toml 和依赖锁文件等完整结构。通过场景化对比（如新项目开发、环境升级或临时测试），帮助开发者精准选择命令。关键比喻：uv venv 提供“空房子”，而 uv init 提供“精装样板房”。掌握区别可显著提升开发效率。

2025-12-09 11:24:59 402

原创 uv终极技巧：一招精准指定Python版本，告别版本混乱！

本文介绍了使用uv工具精准管理Python版本的实用指南。通过三大实战场景（新项目初始化、现有项目版本切换、多版本管理）详解了版本控制方法，包括命令行参数、pyproject.toml配置和.python-version文件等多种方式。文章强调了版本管理对依赖兼容性、团队协作和生产环境一致性的重要性，并提供了版本速查表和疑难解答技巧，帮助开发者彻底解决Python版本冲突问题，实现开发环境的精准控制。

2025-12-09 11:17:36 981

原创一册在手，部署无忧：从零到上线，用uv重构Python项目管理

本文提供了一份完整的uv工具使用指南，涵盖从本地开发到服务器部署的全流程。通过pyproject.toml声明依赖，用uv.lock锁定环境，配合uv sync实现一键环境复现。重点介绍了开发环境初始化、智能依赖管理、环境同步等核心操作，并详细说明了服务器部署流程。强调三大实践准则：使用uv命令替代pip、提交锁文件到Git、通过uv sync恢复环境。该手册帮助开发者建立可靠、可复现的Python项目管理流程，提升开发部署效率。

2025-12-09 11:14:30 712

原创 uv虚拟环境：彻底告别 source activate 的依赖管理新革命！

摘要 Python包管理工具uv通过"免激活"虚拟环境管理彻底简化开发流程。与传统方式相比，uv具备三大核心优势：1)自动项目感知，智能定位项目环境；2)命令级隔离，通过uv run确保环境纯净；3)显式路径封装，避免手动指定路径的繁琐。使用时需注意仅在项目目录下操作，推荐结合uv sync确保环境一致性。最佳实践包括：使用uv add/remove管理依赖、坚持uv run执行脚本、维护pyproject.toml和uv.lock文件。uv实现了更清晰、健壮且可复现的Python开发模

2025-12-09 10:52:06 383

原创解密云计算的“隐形冠军”：NVIDIA T4 GPU，为何能在数据中心长盛不衰？

NVIDIA T4 GPU：专为AI推理而生的数据中心"常青树" 这款基于图灵架构的加速卡凭借独特优势成为云计算领域的主力选择：专精设计：320个Tensor Core支持多精度计算，INT8/INT4推理性能达FP32的8-16倍极致能效：70W超低功耗、单槽半高设计，实现高密度部署四大核心应用：AI推理（NLP/CV）、视频转码、云桌面和边缘计算平衡之道：在性能、功耗与成本间取得完美平衡，虽不适合训练但仍是推理场景性价比首选 T4的成功印证了专精化设计在特定领域的持久价值。

2025-12-09 10:20:21 733

原创 Conda环境清理术：三行命令彻底删除虚拟环境，释放磁盘空间！

本文详细介绍了使用conda删除虚拟环境的多种方法，包括删除指定环境、强制删除及删除当前激活环境的操作步骤。文章强调了删除前的必要检查，提供了完整的删除流程示例，并针对常见问题给出解决方案。同时分享了环境管理的最佳实践，如定期清理、规范命名和及时备份等技巧。通过掌握这些方法，开发者可以高效管理Python开发环境，保持系统整洁有序。文中还包含批量删除脚本等扩展技巧，帮助用户更好地利用conda进行环境管理。

2025-12-09 09:58:51 1909

原创微软开源实时语音合成神器VibeVoice：0.5B参数，一键部署，效果惊艳！

微软开源实时语音合成项目VibeVoice，仅0.5B参数即可实现高质量、低延迟的TTS效果。本文详细介绍从环境准备到快速部署的全流程，包括克隆项目、安装依赖、下载预训练模型等步骤，并推荐GPU云平台供无本地显卡用户使用。通过简单的命令即可启动服务，在Web界面体验实时语音合成。文章还分析了VibeVoice的技术亮点、应用场景及常见问题解答，让开发者能快速上手这一前沿语音AI技术。

2025-12-08 18:59:58 1292

原创第二篇：LangChain 1.0 模块化架构与依赖管理

通过本篇学习，你已经掌握了 LangChain 1.0 模块化架构的核心思想和各包的具体职责。理解分层架构core→主包→厂商包/社区包→classic的清晰分层掌握各包定位：每个包都有明确的职责和使用场景遵循最佳实践：生产环境优先使用厂商包，利用实现灵活性规划迁移路径：为旧版本用户提供平滑的升级体验。

2025-12-02 16:48:53 1082

原创第一篇：LangChain 1.0 框架概述与生态全景

通过本篇学习，你已经了解了 LangChain 1.0 的基本概念、核心价值、生态全景以及如何根据需求选择合适的技术方案。LangChain 1.0 通过统一抽象、简化接口、强化生态与扩展性，使其成为构建生产级大模型应用的有力工具。

2025-12-02 15:13:59 786

原创 LangChain 1.0 智能体开发实战全栈教程：从入门到企业级应用

本教程是一套从零到一、从理论到实战、从单机到企业级的完整学习体系，旨在帮助开发者系统掌握 LangChain 1.0 框架的核心能力，特别是如何构建、部署和管理具备自主感知、推理、行动能力的智能体（Agent）系统。

2025-12-02 14:19:19 1208

原创开源登顶！DeepSeek-V3.2 与 Speciale 双星闪耀，推理能力直逼 GPT-5

深度求索公司发布两款开源大模型DeepSeek-V3.2和V3.2-Speciale，分别针对日常应用和极致推理场景。V3.2实现了思考与工具调用的融合，Speciale版本在国际竞赛中表现突出。两项核心技术突破包括稀疏注意力机制和创新的AI自我训练方法。模型已开源并上线API服务，标志着国产大模型在推理能力上达到国际领先水平。

2025-12-02 11:44:37 712

原创 Docker双模式实战：从零到精通，Dockerfile与Docker Compose全方位构建部署

本文详细讲解Docker的两种构建方式：通过Dockerfile实现精细控制，以及使用Docker Compose实现一站式管理。包含从环境搭建、镜像构建到生产部署的全流程，适合不同水平的开发者。优化版Dockerfile采用多阶段构建、安全加固等最佳实践，生产级docker-compose.yml包含健康检查、资源限制等关键配置。提供双模式构建指南，满足开发调试与生产部署的不同需求。

2025-12-01 17:10:45 1010

原创一招解决 Git 推送私有仓库要密码的问题！GitHub 已禁用账号密码认证，90% 的人还在输错！

GitHub 自 2021 年 8 月起禁用密码认证，开发者需改用 Personal Access Token (PAT) 或 SSH 密钥进行 Git 操作。本文提供详细配置指南：生成 PAT 时需勾选 repo 权限，使用时需将其作为密码输入；更推荐使用 SSH 协议，通过生成密钥对并添加公钥至 GitHub 实现免密操作。文章还澄清了常见误区，强调不要再尝试使用账户密码认证。这些方法能有效解决认证失败问题，提升开发安全性和便利性。

2025-11-27 11:02:02 583

原创一行命令搞定！让 nohup 后台运行程序「彻底静音」不产生日志

摘要：本文介绍如何让Linux程序在后台静默运行且不产生日志文件。通过将nohup命令的输出重定向到/dev/null（nohup sh start_api.sh > /dev/null 2>&1 &），既可保持进程持久性，又能完全丢弃日志输出。适用于稳定服务、测试脚本等无需日志的场景，节省磁盘空间并避免敏感信息泄露。文中解析了命令原理，并提醒仍可通过ps等工具监控进程状态。

2025-11-26 15:10:27 429

极速蒸馏实践：基于 Unsloth 与 LoRA 技术蒸馏 DeepSeek-R1-Distill-Qwen-1.5B 模型实操文件

资源描述内容概要：本资源提供了一套完整的DeepSeek-R1-Distill-Qwen-1.5B模型知识蒸馏实操方案，基于Unsloth工具与LoRA技术，实现高效轻量化的模型微调。资源包含完整代码实现、配置文件、数据预处理脚本及训练评估工具，涵盖了从环境搭建、教师模型选择、蒸馏损失设计到性能评估的全流程。适用人群： - 具备基础深度学习知识的研究人员和算法工程师 - 希望在有限计算资源下进行模型优化的开发者 - 对知识蒸馏技术和高效微调感兴趣的学习者 - 需要轻量化模型部署的工业界从业者使用场景及目标： - **计算资源受限环境**：显存有限（如单卡8GB）但需要训练较大模型 - **快速原型开发**：需要在短时间内验证模型蒸馏效果 - **模型部署优化**：为移动端、边缘设备准备高性能轻量模型 - **学术研究实验**：探索知识蒸馏与参数高效微调的结合方案主要目标： 1. 实现显存占用降低70%以上的高效蒸馏训练 2. 在保留原模型95%以上性能的前提下大幅缩短训练时间 3. 提供可复现、易修改的完整代码框架 4. 展示Unsloth与LoRA在模型蒸馏中的实际应用效果其他说明： - 资源包含完整的错误处理与调试指南 - 提供多种蒸馏策略对比实验代码 - 附有性能监控和可视化工具 - 代码结构清晰，注释详细，适合二次开发 - 兼容主流的深度学习框架和硬件环境 - 包含常见问题解答和优化建议本资源旨在为模型蒸馏实践提供一个可靠、高效的技术解决方案，帮助开发者在资源受限条件下仍能获得优质的模型性能。

2025-12-31

Linux Shell脚本攻略

一本适合爱好编程初学者学习的编程书籍，本书主要讲了Linux的常用命令和如何用shell进行编程。

2018-05-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

极速蒸馏实践：基于 Unsloth 与 LoRA 技术蒸馏 DeepSeek-R1-Distill-Qwen-1.5B 模型 实操文件

Linux Shell脚本攻略

空空如也

极速蒸馏实践：基于 Unsloth 与 LoRA 技术蒸馏 DeepSeek-R1-Distill-Qwen-1.5B 模型实操文件