window环境下通过unsloth在本地微调deepseek模型详细教程

目录

0 基础环境

1 环境准备

1.1 CUDA环境准备

1.2 conda项目环境准备

1.2.1创建conda项目环境

1.2.2 pycharm创建项目

1.2.3 安装unsloth环境

1.3 模型准备

1.4 数据准备

2 逻辑实现

2.1 引入环境变量,未引入会导致找不到c编译器和c标准库

2.2 引入组件包,设定部分模型参数

2.3 加载模型

2.4 构建模型训练提示词模板

2.5 加载训练数据

2.6 将模型设置成微调模式

2.7 训练模型

2.8 保存模型

2.9 测试微调后的模型

附录:

项目结构如下:


0 基础环境

操作系统:windows11

显卡:NVIDIA RTX 2060 6G显存

conda:已安装miniconda

上网:已具备科学上网

1 环境准备

1.1 CUDA环境准备

安装12.4版本CUDA,请参考以下链接:

CUDA安装及环境配置——最新详细版-优快云博客

1.2 conda项目环境准备

1.2.1创建conda项目环境

conda create -n LearnLangchain python=3.10

1.2.2 pycharm创建项目

1.2.3 安装unsloth环境

# 安装torch
 pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124
# 安装unsloth,版本:2025.2.15
pip install unsloth
# 安装triton
pip install .\triton-3.2.0-cp310-cp310-win_amd64.whl
triton下载链接:https://github.com/woct0rdho/triton-windows/releases/download/v3.2.0-windows.post10/triton-3.2.0-cp310-cp310-win_amd64.whl

1.3 模型准备

pip install modelscope

mkdir ./DeepSeek-R1-Distill-Llama-8B

modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Llama-8B --local_dir 
./DeepSeek-R1-Distill-Llama-8B

1.4 数据准备

https://huggingface.co/datasets/FreedomIntelligence/medica l-o1-reasoning-SFT

通过上面的链接下载数据文件。

2 逻辑实现

代码实现参考:‍​​‬‬​​​‍‍‌⁠​​‍​​‍​‌​​‍​​​​‌‬​‬​DeepSeek R1 Distill高效微调入门实战 - 飞书云文档

2.1 引入环境变量,未引入会导致找不到c编译器和c标准库

import os
# os.environ["UNSLOTH_USE_TRITON"] = "False"
import sys
sys.stdout.reconfigure(encoding='ut
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值