Xtuner微调小助手

最新推荐文章于 2025-04-25 15:24:01 发布

Orkeii

最新推荐文章于 2025-04-25 15:24:01 发布

阅读量246

点赞数 1

文章标签：人工智能

本文链接：https://blog.youkuaiyun.com/Orkeii/article/details/138453768

版权

本文探讨了微调在AI中的两种范式——增量预训练微调和指令跟随对话模板训练，重点介绍了Xtuner的数据处理关注内容质量。此外，还涵盖了全参数微调（包括LoRA和QLoRA优化）、4bit量化以及文本与图像多模态模型LLaVA的实践案例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

参考：Tutorial/xtuner/personal_assistant_document.md at camp2 · InternLM/Tutorial (github.com)

微调两种范式：

增量预训练微调
- 使用场景：让底座模型学习新知识，例如某个垂直领域的常识
- 训练数据：文章、书籍、代码等
指令跟随微调
- 使用场景：让模型学会对话模板，根据人类指令进行对话
- 训练数据：高质量对话、问答数据

Xtuner数据处理：专注于数据的内容质量

微调方案

全参数微调加载模型和参数优化器
LoRA 加载模型和adapter的优化器
QLoRA 加载4bit量化后的模型和adapter的优化器

文本+图像多模态模型：LLaVA（识图而非生图）

作业实现：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Orkeii

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

XTuner微调个人小助手认知

forinout的博客

08-06

1900

对于全量微调的模型（full）其实是不需要进行整合这一步的，因为全量微调修改的是原模型的权重而非微调一个新的 Adapter ，因此是不需要进行模型整合的。比如我们这里微调的是书生·浦语的模型，我们就可以匹配搜索。在 PART 1 的部分，由于我们不再需要在 HuggingFace 上自动下载模型，因此我们先要更换模型的路径以及数据集的路径为我们本地的路径。在准备好了模型和数据集后，我们就要根据我们选择的微调方法结合微调方案来找到与我们最匹配的配置文件了，从而减少我们对配置文件的修改量。

大模型笔记之-XTuner微调个人小助手认知

JunHowie的个人Blog

08-22

349

使用XTuner 微调个人小助手认知。

参与评论您还未登录，请先登录后发表或查看评论

02 XTuner 微调小助手认知

weixin_52386946的博客

05-06

215

使用官方准备好的配置文件进行训练。目录下的gdata.py。

第四课作业 XTuner微调小助手+多模态llava

weixin_44555688的博客

04-18

1021

7.webdemo部署成功，明显过拟合，只会说一句话。显存占用4720/8182MB，表明推理需要4GB左右。2.微调模型，使用了deepseed_zero2加速，训练完成，约30分钟，占用显存16620MB。3.训练中，耗时较长约一小时，训练log基本沿用了mmdet的格式，都用的。通过QLORA训练出Adapter模型，整合为完整模型并应用于垂类任务。2.数据集、前期准备完成，配置文件修改完成。4.训练完成、HF.bin格式转换完成。5.模型整合成功，过程需要大概五分钟。1.环境完成，配置文件完成。

XTuner 微调个人小助手认知

m0_70461552的博客

08-29

751

在 “创建开发机” 界面，选择开发机类型：个人开发机，输入开发机名称：XTuner微调，选择开发机镜像：Cuda12.2-conda。进入开发机之后，请确保自己已经克隆了Tutorial仓库的资料到本地。在安装 XTuner 之前，我们需要先创建一个虚拟环境。虚拟环境创建完成后，就可以安装 XTuner 了。首先，从 Github 上下载源码。最后，我们可以验证一下安装结果。软件安装好后，我们就可以准备要微调的模型了。

XTuner 微调个人认知小助手

weixin_45924641的博客

04-15

1312

基于 XTuner用 QLoRA 的方式来微调InternLM1.8B模型得到一个自己的小助手

XTuner 微调个人小助手认知任务

chasemydreamidea的博客

09-24

1204

XTuner是全链条开源开放的一个高效微调的框架，它适配多种生态，即就是多种微调算法：多种微调&偏好对齐算法，覆盖各类应用场景。适配多种开源生态，支持加载HuggingFace、ModelScope模型或者数据集。自动优化加速即就是开发者无需关注复杂的显存优化与计算加速细节，支持千亿参数+百万上下文训练。适配多种硬件，训练方案覆盖NVIDIA20系列以上所有显卡，最低只需8GB显存即可微调7B模型。二：XTuner个人小助手微调实践。

成功使用XTuner 微调个人小助手

qq_22876439的博客

08-10

693

两个小时入门一下微调模型，形成一个雏形

XTuner微调个人小助手认知(练习笔记)

zhidong007的专栏

09-20

723

本节主要重点是带领大家实现个人小助手微调，如果想了解微调相关的基本概念，可以访问XTuner微调前置基础。环境安装：我们想要用简单易上手的微调工具包 XTuner 来对模型进行微调的话，第一步是安装 XTuner ！安装基础的工具是一切的前提，只有安装了 XTuner 我们才能够去执行后续的操作。前期准备：在完成 XTuner 的安装后，我们下一步就需要去明确我们自己的微调目标了。我们想要利用微调做一些什么事情呢，然后为了实现这个目标，我们需要准备相关的硬件资源和数据。启动微调：在确定了自己的微调目标后，我

XTuner 微调个人小助手实践学习笔记(2)

yizhiboshanshan的博客

08-12

477

由于之后想自己微调一个角色扮演的小助手，于是先试着微调一下公开数据集，练练手，后续再自己准备数据集。

Python项目--基于计算机视觉的手势识别控制系统

exlink2012的专栏

04-23

1766

随着人机交互技术的快速发展，传统的键盘、鼠标等输入设备已经不能满足人们对自然、直观交互的需求。手势识别作为一种非接触式的人机交互方式，具有操作自然、交互直观的特点，在智能家居、游戏控制、虚拟现实等领域有着广泛的应用前景。本项目旨在开发一个基于计算机视觉的手势识别控制系统，通过摄像头捕获用户的手部动作，实时识别手势类型，并将识别结果转化为相应的控制命令，实现对计算机或其他设备的非接触式控制。

人工智能(AI)对网络管理的影响

最新发布

ITmoster的博客

04-25

539

AI正从工具演变为网络管理的“核心大脑”，其价值不仅在于效率提升，更在于为复杂问题提供系统性解决方案。

LibrePhotos本地部署打造个人云相册安全存储和分享家庭照片(1)

YYDsis的博客

04-24

1248

手机里塞满了珍贵回忆，却担心一不小心就被偷看？别怕，今天我就教你一个绝招——使用自建私有云相册。这不仅比Google Photos更安全可控，还无需公网IP或域名，因为咱们有cpolar这个神器来帮忙打通内网壁垒！跟着我一起，让你的照片管理从此变得既酷又安全吧！

计算机视觉各类任务评价指标详解

qq_47898999的博客

04-25

876

计算机视觉各类任务评价指标详解

tokenizer的用法

大多_C的博客

04-25

422

可以基于现有 tokenizer 进行修改，如添加自定义的 token（tokenizer.add_tokens([“新词”])），从而扩展词汇表，此时可调用 tokenizer.resize_token_embeddings(model) 更新模型嵌入层。]}，有时还会包含其他信息比如 “token_type_ids”、“offset_mapping”（用于对齐）等。• return_tensors: 指定返回类型，如 “pt”（PyTorch tensor）、“tf” 或 “np”（NumPy 数组）

视频汇聚平台智能边缘分析一体机视频智能分析平台智能分析区域入侵检测算法

LntonCEC的博客

04-22

642

这种设备的广泛应用不仅能够提高安全防范的效率和准确性，还能够为各类场所的安全管理提供强大的支持和帮助，从而为社会的稳定和发展做出了积极的贡献。这种设备通过集成图像处理、智能识别和实时监测等先进技术，能够对特定区域内的入侵行为进行有效的监控和识别，从而及时地发现潜在的安全风险并采取适当的应对措施。智能边缘分析一体机的区域入侵检测功能能够提高安全监控系统的警戒性和反应速度，有效减少安全风险和事件发生的可能性，为各类场所（如公共场所、企业园区、仓库等）的安全管理带来极大的便利和帮助。

PyTorch生成式人工智能实战（3）——分类任务详解

盼小辉丶的博客

04-25

858

在本节中，将学习如何使用 PyTorch 创建深度神经网络来执行二分类和多类别分类任务，以便熟练掌握深度学习和分类任务。具体而言，我们将构建一个完整的端到端深度学习项目，使用 PyTorch 将灰度图像的服装物品分类为不同类别，包括外套、包、运动鞋、衬衫等。目的是创建能够执行二分类和多类别分类任务的深度神经网络，为后续学习奠定基础。

AI 工程师崛起：科技浪潮下的新兴力量

2401_86652632的博客

04-25

593

在当今科技迅猛发展的时代，人工智能（AI）无疑是最热门的领域之一。随着基础模型的涌现和开源 / API 的普及，一种新兴的职业 ——AI 工程师，正逐渐崭露头角。他们在 AI 技术的应用和开发中扮演着关键角色，其崛起背后有着诸多深刻的原因，并且正在重塑整个科技行业的格局。今天，就让我们深入探究 AI 工程师这一职业的发展脉络。

软件专利申请：审查意见是“拦路虎“还是“磨刀石“？

wdip15的博客

04-22

699

根据统计，超过85%的专利申请都会经历至少一次审查意见。这不一定是坏事——经过修改的专利，授权后更经得起无效宣告的挑战。就像璞玉需要雕琢，好的专利也是"磨"出来的。下次收到审查意见时，不妨泡杯茶，仔细看看审查员的"批注"。也许你会发现，这恰恰是让技术方案更严谨的好机会。毕竟，专利申请不是"一锤子买卖"，而是场需要智慧的持久战。申请过软件专利的朋友常问："是不是每次申请都会收到一两次审查意见？"作为过来人，今天咱们就用大白话聊聊这个事儿。

xtuner大模型微调

04-02

### 使用 XTuner 进行大模型微调的方法教程 #### 1. 构建数据集为了使模型能够学习特定的任务或行为，首先需要准备高质量的数据集。根据需求，可以创建一个对话形式的数据集，其中包含提问和对应的理想回答。这些数据将用于指导模型的学习方向[^1]。 ```bash # 数据集应保存为 JSONL 文件格式，每条记录是一个独立的对话样本。 { "instruction": "解释什么是机器学习", "input": "", "output": "机器学习是一种通过算法让计算机从经验中自动改进的技术..." } ``` #### 2. 配置文件编写 XTuner 的配置文件定义了训练的具体参数以及使用的模型架构等信息。以 `internlm_chat_7b` 模型为例，可以通过修改现有的 `.py` 配置模板来适配自己的任务场景[^3]。以下是简化版配置文件的一个片段： ```python from xtuner.engine import Config model = dict( type='InternLM', version='chat-7b' ) train_dataset_type = 'CustomDataset' data_root = '/path/to/dataset' max_epochs = 3 per_device_train_batch_size = 4 gradient_accumulation_steps = 8 learning_rate = 5e-5 weight_decay = 0.01 warmup_ratio = 0.05 lr_scheduler_type = 'cosine' logging_dir = './logs' save_total_limit = 3 checkpointing_steps = 1000 fp16 = True bf16 = False deepspeed_config_path = "/root/deepspeed_zero2.json" work_dir = "./work_dirs/assistTuner" cfg = Config(locals()) ``` #### 3. 开始微调过程利用 XTuner 提供的命令行工具可以直接运行指定配置下的微调流程。下面展示了一个典型的执行指令案例: ```bash xtuner train ./config/internlm2_5_chat_7b_qlora_alpaca_e3_copy.py \ --deepspeed deepspeed_zero2 \ --work-dir ./work_dirs/assistTuner ``` 此命令会加载预设好的超参设置并基于 DeepSpeed 技术加速计算效率，在工作目录下逐步存储中间结果与最终完成后的权重文件。 #### 4. 转换至 Hugging Face 格式当微调完成后如果希望分享成果或者进一步部署应用，则可能需要用到标准框架支持的形式。XTuner 支持把内部生成的结果导出成兼容 Hugging Face Transformers 库的标准结构化存档[^2]。转换操作如下所示: ```bash xtuner convert-to-hf-model \ ./work_dirs/assistTuner/best_model.pth \ /root/output/huggingface_model/ ``` 这样就可以轻松地与其他依赖该生态系统的项目集成起来了。 ---