Transformer实战——使用 run_glue.py 微调模型

最新推荐文章于 2025-12-16 16:32:45 发布

原创

最新推荐文章于 2025-12-16 16:32:45 发布 · 281 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#transformer #深度学习 #人工智能

在现代自然语言处理（NLP）领域，Transformer架构已经成为了主流模型。其卓越的性能在各种任务上都展现得淋漓尽致，从文本分类到问答系统，Transformer模型的应用无处不在。本文将详细介绍如何使用`run_glue.py`脚本微调Transformer模型，特别是在GLUE（General Language Understanding Evaluation）基准上进行实战。

## 1. 什么是GLUE？

GLUE是一个多任务基准，旨在评估和比较自然语言处理模型在多种语言理解任务上的表现。它包括多个子任务，如文本蕴含、情感分析、问答等。通过在GLUE上进行微调，模型的泛化能力和性能得到了有效检验。

## 2. 环境准备

在开始微调之前，需要确保已经搭建好相应的环境。一般来说，推荐使用Python 3.6及以上版本，并安装流行的深度学习框架如PyTorch或TensorFlow。

### 2.1 安装依赖

首先，安装基础依赖项，你可以使用以下命令：

```bash
pip install transformers
pip install datasets
pip install torch # 如果你使用的是PyTorch
```

如果你打算使用TensorFlow，则需要安装TensorFlow：

```bash
pip install tensorflow
```

### 2.2 下载模型和数据集

Hugging Face的Transformers库提供了多种预训练模型，这为我们的微调过程提供了便利。你可以选择BERT、RoBERTa等模型。以下是获取模型和GLUE数据集的步骤：

```bash
git clone https://github.com/huggingface/transformers.git
cd transformers/examples/pytorch/text-classification
```

### 2.3 数据集准备

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

hdrhdrjdididrr

关注关注

5
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Pytorch框架下的transformers的使用

江户香葱饼的博客

08-01

1万+

huggingface团队在pytorch框架下开发了transformers工具包：https://github.com/huggingface/transformers，工具包实现了大量基于transformer的模型，如albert，bert，roberta等。工具包的代码结构如图所示：其中比较重要的是src/transformers以及example这两个文件夹。其中，src/transformers文件夹下是各类transformer模型的实现代码；而examples下主要是各类下游任务的

run_glue.py微调脚本代码

あずにゃん梓喵的博客

07-25

1649

日萌社 人工智能AI：Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战（不定时更新） # coding=utf-8 # Copyright 2018 The Google AI Language Team Authors and The HuggingFace Inc. team. # Copyright (c) 2018, NVID...

参与评论您还未登录，请先登录后发表或查看评论

NLP基准数据 —— GLUE

weixin_45828972的博客

12-29

2641

NLP基准数据（Benchmark Dataset）—— GLUE，包含九项NLU任务

GLUE基准数据集介绍

热门推荐

yaohaishen的专栏

03-24

1万+

图1：整篇文章的思维导图一、简介自然语言处理（NLP）主要自然语言理解（NLU）和自然语言生成（NLG）。为了让NLU任务发挥最大的作用，来自纽约大学、华盛顿大学等机构创建了一个多任务的自然语言理解基准和分析平台，也就是GLUE（General Language Understanding Evaluation）。 GLUE包含九项NLU任务，语言均为英语。GLUE九项任务涉及到自然语言推断、文本蕴含、情感分析、语义相似等多个任务。像BERT、XLNet、RoBERTa、ERINE、T.

BERT源码注释(run_classifier.py) - 全网最详细

putdoor的博客

06-27

7181

摘要：本文为BERT模型的run_classifier.py的详细注释，便于了解模型内部究竟做了什么？模型可调参数有哪些？自己写一个processor的类，需要注意哪些？想要运行这个脚本，需要传入哪些参数？尽在本文详细注释！ # coding=utf-8 # bert注解版 # author：putdoor """BERT finetuning runner.""" from __future...

Transformers 示例 | 六

TensorFlowNews

03-30

2744

作者|huggingface 编译|VK 来源|Github 在本节中，将结合一些示例。所有这些示例都适用于多种模型，并利用了不同模型之间非常相似的API。重要：要运行示例的最新版本，你必须从源代码安装并为示例安装一些特定要求。在新的虚拟环境中执行以下步骤： git clone https://github.com/huggingface/transformers cd transforme...

文本分类——GLUE数据集介绍

哈哈哈的博客

11-30

3122

如果要用一句话形容文本分类任务在NLP中的应用之广，某种程度上，大概这句话最适合：一切NLP皆分类。通常来说，NLP可以分为自然语言理解（NLU）和自然语言生成（NLG）。在NLU方面，我们拿时下最流行的GLUE(General Language Understanding Evaluation)排行榜举例，其上集合了九项NLU的任务，分别是 CoLA(The Corpus of L...

GLUE数据集介绍

bbbbbubble的博客

02-22

799

From: http://www.xuwei.io/2018/11/30/%E6%96%87%E6%9C%AC%E5%88%86%E7%B1%BB-glue%E6%95%B0%E6%8D%AE%E9%9B%86%E4%BB%8B%E7%BB%8D/ GLUE榜单地址：https://gluebenchmark.com/leaderboard/ NLP可以分为自然语言理解（NLU）和自然语言生成（NLG）。在NLU方面，我们拿时下最流行的GLUE(General Language Understanding

GLUE数据集下载（Bert，XLNet等使用数据集）

kejizuiqianfang的博客

12-16

4157

GLUE数据集下载 GLUE数据集官方网址：https://gluebenchmark.com/tasks 下载方式：https://github.com/nyu-mll/GLUE-baselines 因为这些GLUE的官网在国外，而GitHub上面的下载地址也在国外，所以你过你可以翻出去的话，下载不成问题，如果翻不出去的话，你可以用下面的我上传的链接下载： ...

GLUE多任务数据集介绍

DarrenXf的专栏

04-07

1万+

GLUE 是一个自然语言任务集合，包括以下这些数据集 name full name task chinese MNLI Multi-Genre NLI Natural language inference 自然语言推断 QQP Quora Quora Question Pairs Semantic textual similarity/Paraphrase identifica...

最强 NLP 预训练模型库 PyTorch-Transformers 正式开源：支持 6 个预训练框架，27 个预训练模型...

kyle1314608的博客

07-23

1292

先上开源地址： https://github.com/huggingface/pytorch-transformers#quick-tour 官网： https://huggingface.co/pytorch-transformers/index.html PyTorch-Transformers（正式名称为 pytorch-pretrained-bert）是一个用于自然语言处...

NLP GLUE baseline环境搭建

qq_39990296的博客

10-31

784

glue baseline

NLP迁移学习

qq_46107892的博客

04-25

561

迁移学习第一步下载微调脚本文件 # 克隆huggingface的transfomers文件 git clone https://github.com/huggingface/transformers.git # 进行transformers文件夹 cd transformers # 安装python的transformer工具包, 因为微调脚本是py文件. pip install . # 当前的版本可能跟我们教学的版本并不相同，你还需要执行： pip install transformers==2

迁移学习-微调脚本的方法

云计算、数据库、大数据、容器、微服务、深度学习、NLP、Python

04-29

559

微调脚本文件下载微调脚本:是huggingface研究机构向我们提供了针对GLUE数据集合任务类型的微调脚本, 这些微调脚本的核心都是微调模型的最后一个全连接层，通过参数配置来指定GLUE中存在任务类型, 以及指定需要微调的预训练模型克隆huggingface的transfomers文件 git clone https://github.com/huggingface/transformer...

训练BERT，我只花了一半的时间

算法码上来

07-14

1660

相信很多人都知道Hugging Face，也都用过它的Transformers预训练语言模型，但你们有没有觉得它训练的有点太慢了呢？这时候，字节第二快的男人要站出来了（第一快是我mentor），手把手教你怎么让训练时间缩短一半。训练BERT首先我们要安装Transformers库，这很简单：pip install transformers然后我们直接把官方的例子拷贝下来，这里我们用的是GLUE任务...

【文献阅读】DP-Site：一种基于双重深度学习的蛋白质-肽相互作用位点预测方法

weixin_42038527的博客

12-16

773

研究团队开发了一款名为DP-Site的AI工具，仅需分析蛋白质的氨基酸序列（“设计图”），就能精准锁定小分子药物的潜在“靶点”。DP-Site的核心创新在于其 “双专家会诊”模式。一位是“图像专家”，擅长分析序列的局部结构特征；另一位是“语义专家”，擅长理解序列的全局上下文信息。两者协同工作，使其预测综合性能（F1分数）达到0.661，超越此前所有方法。

基于知识图谱+深度学习的大数据NLP医疗知识问答可视化系统（全网最详细讲解及源码/建议收藏）

未来社会二十年发展的核心技术趋势由ABCD四个字母组成，分别是AI（人工智能）、BlockChain（区块链）、Cloud（云）、和Data（大数据）每一次进步都有新的认知和感触

12-15

1113

本文详细介绍了一个基于知识图谱与深度学习的医疗问答系统。系统采用Neo4j存储医疗知识图谱，使用Aho-Corasick算法进行高效多模式匹配，并整合了BERT+LSTM+CRF深度学习模型。实现流程包括数据爬取、清洗、实体识别、知识图谱建模等步骤，最终构建了一个具有可视化界面的Flask应用。系统支持自然语言问答，能自动存储交互记录到SQL数据库。文章还详细说明了所需的软件环境配置（JDK1.8、Neo4j4.4.5等）和项目目录结构，为开发者提供了完整的实现方案和技术细节。

基于深度学习的肾结石检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

最新发布

ningfoshao8678的博客

12-16

940

本文介绍了基于YOLO目标检测算法开发的肾结石检测系统。该系统支持图片、视频、文件夹批量及摄像头实时检测，包含用户登录、多模型切换等功能。技术栈采用Python3.10、PyQt5和SQLite，对比了YOLOv5/v8/v11/v12四种模型性能，其中YOLO12n精度最高(mAP40.6%)，YOLO11n速度最快(56.1ms)。系统在17000张肾脏影像数据集上训练，mAP@0.5达90%，F1值0.86，能有效识别肾结石位置并显示置信度。

07-17

- **检查预训练权重来源**：确认使用的预训练权重是否与当前模型（如`transformer dec_score_head`部分）匹配。例如，如果使用DETR模型，则预训练权重应该是针对相同层数和头数的DETR模型。 - **检查模型结构参数*...