PyTorch实战：使用transformers的Trainer微调预训练模型

最新推荐文章于 2025-03-10 15:34:04 发布

fengbeely

最新推荐文章于 2025-03-10 15:34:04 发布

阅读量672

点赞数 4

文章标签： pytorch 机器学习深度学习

本文链接：https://blog.youkuaiyun.com/fengbeely/article/details/140407030

版权

背景

transformers提供了非常便捷的api来进行大模型的微调，下面就讲一讲利用Trainer来微调大模型的步骤

第一步：加载预训练的大模型

from transformers import AutoModelForSequenceClassification

model = AutoModelForSequenceClassification.from_pretrained("distilbert-base-uncased")

第二步：设置训练超参

from transformers import TrainingArguments

training_args = TrainingArguments(
    output_dir="path/to/save/folder/",
    learning_rate=2e-5,
    per_device_train_batch_size=8,
    per_device_eval_batch_size=8,
    num_train_epochs=2,
)

比如这个里面设置了epoch等于2

第三步：获取分词器tokenizer

from transformers import AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased")

第四步：加载数据集

from datasets import load_dataset

dataset = load_dataset("rotten_tomatoes")  # doctest: +IGNORE_RESULT
<

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

fengbeely

关注关注

4
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【Transformer-Hugging Face手册 07/10】微调预训练模型

gongdiwudu的专栏

02-07

3343

使用预训练模型有显着的好处。它可以降低计算成本和碳足迹，并允许您使用最先进的模型，而无需从头开始训练。 🤗 Transformers 提供了针对各种任务的数千个预训练模型的访问权限。当您使用预训练模型时，您可以在特定于您的任务的数据集上对其进行训练。这被称为微调，是一种非常强大的训练技术。

Hugging Face Transformers进阶：模型微调与训练

05-03

模型微调是指在预训练模型的基础上，针对特定任务进行进一步训练的过程。预训练模型通常在大规模通用语料上进行训练，能够学习到语言的通用特征。然而，这些模型可能无法直接适应特定任务的需求。通过在特定任务的数据集上继续训练，我们可以调整模型的参数，使其更好地捕捉任务相关的特征，从而提升模型在该任务上的性能。定义训练循环是微调过程的核心步骤。加载数据：使用Dataset类加载数据集。定义模型：加载预训练模型，并根据任务需求添加额外的层（如分类层）。定义优化器和损失函数：选择合适的优化器和损失函数。训练模型。

参与评论您还未登录，请先登录后发表或查看评论

大模型底层 transformers源码解析之trainer.py

强化学习曾小健

04-17

4046

我会根据你提供的trainer.py源代码,用python的Graph包画出流程图,并着重介绍train()方法。- 将 inputs 通过 self._prepare_inputs 方法处理后传给 self.training_step。- 调用 optimizer.step() 和 lr_scheduler.step() 进行参数更新。计算总共需要训练的步数 max_steps 和 num_train_epochs。- 每 args.logging_steps 个步骤打印训练日志。

在PyTorch里面利用transformers的Trainer微调预训练大模型

duzm200542901104的专栏

09-20

1700

利用Trainer提供的api，只需要简简单单的九步，十几行代码就能进行大模型的微调，你要不要动手试一试？

【Hugging Face】transformers 库中 Trainer 常用方法和属性

彬彬侠的博客

03-10

671

Trainer 是 Hugging Face transformers 提供的高层 API，用于简化 PyTorch Transformer 模型的训练、评估和推理，支持多 GPU 训练、梯度累积、混合精度训练等。常用方法：trainer.train() 进行训练，trainer.evaluate() 进行评估，trainer.predict(test_dataset) 进行推理，trainer.save_model(path) 保存模型，trainer.log(metrics) 记录日志，t

9个技巧让你的PyTorch模型训练变得飞快！

AI公园

11-15

1960

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：William Falcon编译：ronghuaiyang导读一个step by step的指南，非常的实用。不要让你的神...

【Transformers基础入门篇7】基础组件之Trainer

hjxu2016的博客

09-25

1355

Trainer是库中提供的训练的函数，内部封装了完整的训练、评估逻辑，并集成了多种的后端，如等，搭配对训练过程中的各项参数进行配置，可以方便快捷地启动模型单机/分布式训练使用Trainer进行模型训练对模型的输入输出是有限制的，要求模型返回元组或者的子类如果输入中提供了labels，模型要能返回loss结果，如果是元组，要求loss为元组中的第一个值。

【AI大模型】Transformers大模型库（十一）：Trainer训练类

人工智能领域博客

06-20

3250

在Hugging Face的Transformers库中，Trainer类是一个强大的工具，用于训练和评估机器学习模型。它简化了数据加载、模型训练、评估和日志记录的过程。

【迁移学习应用】：PyTorch NLP中的预训练模型使用指南

在特定任务上，通过继续训练或微调预训练模型，可以取得比从头开始训练更好的效果和更高的效率。 ## 1.3 选择合适的预训练模型不同类型的预训练模型适用于不同的任务。例如，在NLP领域，BERT、GPT和XLNet等模型是...

【Fine-Tuning】大模型微调理论及方法, Pytorch&HuggingFace微调实战

qq_19300283的博客

10-09

1709

大模型微调是指在预训练的大型模型基础上，使用特定数据集进行进一步训练，以适应特定任务或领域。首先收集数据, 分成训练验证测试, 老生常谈, 都2024年了就不多说了预处理: 每种大模型都有特定的输入格式, 要把原始数据转换成预训练大模型认识的数据输入。

【Hugging Face】transformers 库中的 Trainer：简化 PyTorch 模型的训练、评估和推理

彬彬侠的博客

03-09

921

Trainer是Hugging Face transformers库提供的一个高级API，用于简化PyTorch模型的训练、评估和推理，适用于文本分类、翻译、摘要、问答等NLP任务。它支持：自动批量训练，多GPU训练，自动梯度累积，混合精度训练，模型评估，与datasets兼容的数据加载只需几行代码即可完成数据加载、训练、评估、推理。支持多GPU、混合精度训练，优化计算资源使用。适用于NLP任务的Transformer微调，如果需要更精细的控制，可使用PyTorch原生训练循环。

pytorch-large-model-support:PyTorch中的大型模型支持

04-14

<征求反馈> PyTorch LMS用户最近打开了一个问题，要求社区支持以将LMS集成到PyTorch的正式版本中：这是一个很好的机会，可以收集所有用户的推荐书和成功案例，以证明LMS在公共场所的价值。请随时在对话中分享您的支持和任何想法。 </要求反馈> PyTorch大型模型支持 PyTorch大型模型支持（LMS）是（WML CE）提供的PyTorch的功能，它允许成功训练深度学习模型，否则将耗尽GPU内存并因“内存不足”而中止错误。 LMS通过在不需要张量时临时将张量交换到主机内存来管理GPU内存的超额订购。 深度学习模型的一个或多个元素可能导致GPU内存耗尽。这些包括：模型深度和复杂度基本数据大小（例如，高分辨率图像）批量大小传统上，解决此问题的方法是修改模型，直到模型适合GPU内存为止。但是，这种方法会对准确性产生负面影响，尤其是在通过降低数据保真

pytorch-trainer:PyTorch的培训师像Chainer的培训师

04-24

PyTorch的培训师像Chainer的培训师我们可以在PyTorch上使用Trainer，Evaluator，Extension和Reporter。安装 pip install git+https://github.com/Hiroshiba/pytorch-trainer 例子请参阅是从modifyed 。 # Train with Trainer PYTHONPATH= ' . ' python examples/train_mnist.py \ --device cuda \ --autoload \ --epoch 5 LogReport扩展的日志： epoch main/loss validation/main/loss main/accuracy validation/main/accuracy elapsed_time 0

Pytorch-Lightning中的训练器--Trainer

kuxingseng123的博客

01-30

9773

慢慢的将其常用库都给其搞明白，明天开始马慢慢的将Lighting代码框架全部搞定。

Transformers实战——Trainer和文本分类

厚积而薄发

11-16

2073

【代码】Transformers实战——Trainer和文本分类。

9个技巧让你的 PyTorch 模型训练飞快！

Python数据挖掘

12-30

2767

也许你仍然在使用32位精度进行计算，或者甚至只是在单个GPU上进行训练。然而，随着科技的进步，我们已经有了更好的选择。使用更高精度的计算，如16位浮点数或混合精度，可以提高训练速度并减少内存消耗。同时，利用多个GPU进行并行训练，可以大大加快训练过程。我在这里总结了提升Pytorch模型训练速度的9个技巧，与大家分享，

使用PyTorch开发AI大模型

AI天才研究院

01-21

2070

1.背景介绍在过去的几年里，人工智能(AI)技术的发展迅速，尤其是深度学习(Deep Learning)技术，它已经成为解决许多复杂问题的关键技术之一。PyTorch是一个流行的深度学习框架，它提供了易于使用的API，使得开发人员可以快速地构建和训练AI大模型。在本文中，我们将讨论如何使用PyTorch开发AI大模型，包括背景介绍、核心概念与联系、核心算法原理和具体操作步骤、数学模型公式详细讲...

Trainer：PyTorch中的通用模型训练框架

gitblog_00080的博客

06-09

669

Trainer：PyTorch中的通用模型训练框架去发现同类优质开源项目:https://gitcode.com/ Trainer是一个基于PyTorch的模型训练库，它提供了一个简洁易懂的代码结构，使您能快速高效地实现和优化您的深度学习模型。项目介绍这个开源项目旨在简化和标准化模型的训练过程，无论您是初级开发者还是经验丰富的数据科学家。通过Trainer，您可以轻松地定义和训练模型，同时...

pytorch-模型训练

wyw0000的博客

06-27

1807

pytorch 模型训练

使用 PyTorch 与 Hugging Face PEFT 库进行 QLoRA 微调，结合 Transformers Trainer 实现高效训练 . 解释一下以上信息

03-11

好的，我现在要解释如何使用PyTorch和Hugging Face的PEFT库进行QLoRA微调，并结合Transformers的Trainer来实现高效训练。首先，我需要回忆一下QLoRA的基本概念，可能和LoRA有关，对吧？LoRA是低秩适应，用于高效微调...