transformers两个入门示例

最新推荐文章于 2025-06-21 22:42:50 发布

luffy5459

最新推荐文章于 2025-06-21 22:42:50 发布

阅读量1.4k

点赞数

CC 4.0 BY-SA版权

分类专栏：人工智能文章标签： transformer 深度学习人工智能 pytorch image-detect

本文链接：https://blog.youkuaiyun.com/feinifi/article/details/130795867

根据《attention is all you need》论文而形成的transformers框架在chat-gpt应用中大放异彩，目前transformers框架已经成了炙手可热的框架。它不仅在nlp方面很作用很大，根据官网的介绍，它还可以做很多事情，比如图片分类，目标检测。

下面结合官网示例，给出两个简单的示例，一个是文本处理，另一个是目标检测。

transformers框架提供了pipeline的方式，可以快速运用一个模型到输入对象上。官方的原话是：

To immediately use a model on a given input (text, image, audio, ...), we provide the pipeline API

在进行示例之前，我们需要安装transformers框架，本机安装的是transformers=4.26.1

pip install transformers==4.26.1

第一个文本处理的例子，利用transformers快速区分积极和消极的文本内容。如下所示，我们输入一段文字，transformer会给出判断：

from transformers import pipeline
classifier = pipeline('sentiment-analysis')
res = classifier('we are happy to indroduce pipeline to the transformers repository.')
print(res)

运行这段代码，可以得到如下结果：

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

luffy5459

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

Hugging Face Transformers入门：概念与基础

加入“Super Entity”，与全能开发团队共探AI智能体与数字人项目，开启前沿技术之旅。

05-03

158

Hugging Face是一家专注于自然语言处理的公司，其开发的Transformers库是一个开源的Python库，提供了对各种预训练Transformer模型的简单访问和操作。Transformers库的核心优势在于它能够轻松加载、微调和部署预训练的Transformer模型，这些模型已经在大规模文本数据上进行了预训练，能够捕捉语言的通用特征。通过微调这些模型，研究人员和开发者可以在特定的NLP任务上获得出色的性能，而无需从头开始训练模型，从而大大节省了时间和计算资源。

transformers库快速入门

白话机器学习

10-08

211

Transformers 库的API：主要包括配置(configuration)、模型(model)、分词器(tokenizer)和流水线(pipeline)这几个最重要的类。MODELS：库中和每个模型实现有关的类和函数。：内部使用的工具类和函数。

参与评论您还未登录，请先登录后发表或查看评论

Transformer模型解析（附案例应用代码）

LIUMAO99的博客

08-14

6988

自注意力机制是Transformer模型的核心，它允许模型在编码每个单词时同时关注序列中的其他单词，从而捕捉到单词之间的依赖关系。位置编码的生成使用了正弦和余弦函数的不同频率，以确保编码在不同维度上具有不同的模式，从而使模型能够区分不同位置的单词。这样，每个头可以学习到序列的不同方面，最终的输出是所有头输出的连接和线性变换的结果。通过结合残差连接和层归一化，Transformer模型能够有效地训练深层网络，同时保持稳定的梯度流动和良好的特征分布，这对于理解和生成复杂的序列数据至关重要。

transformer例子

weixin_44685702的博客

12-04

779

在我们的例子中，我们可以假设有两个头，每个头的 W_Q，W_K，W_V 不同，从而得到不同的关注模式，最后将各个头的输出拼接起来，进一步丰富表示。为了更好地理解 Transformer 中的自注意力机制，通过一句简单的中文句子“我爱你”为例，逐步解释 Q（查询）、K（键）、V（值）矩阵的计算和作用。通过自注意力机制，我们为每个词生成了新的表示，这些表示不仅包含了该词自身的信息，还融合了与其他词的相关信息。：融合了“你”对“我”和“爱”的关注，体现了“你”在被“我”所“爱”。为 4x4 的单位矩阵。

Transformer架构每层详解【代码实现】

最新发布

z1zyy的博客

06-21

756

其实，我们输入的shape是(2,5)，输出的shape是(2,5,128)你可以理解为多了一个维度，这个维度用来表示每个字在第三维度空间中的向量值。2表示两个句子，5表示每个句子5个字，128表示一个字用128维向量表示加入位置编码只是相加的过程，不会改变形状。# module: 代表要克隆的目标网络层# N: 将module克隆几个测试代码vocab = 8pad=7#编码器端mask，需要最终我们实现了一个编码器，也就是把输入的句子，每个词都根据上下文得到了一个128维向量。

transformer使用示例

ox180x的博客

12-22

1971

关于transformer的一些基础知识，之前在看李宏毅视频的时候总结了一些，可以看here，到写此文章时，也基本忘的差不多了，故也不深究，讲两个关于transformer的基本应用，来方便理解与应用。序列标注参考文件transformer_postag.py. 1. 加载数据12#加载数据train_data, test_data, vocab, pos_voc...

Transformer详解与案例

t1274171989的博客

11-08

2426

记录自己的Transformer学习过程

Transformer示例【tensorflow 2.2】

gdhy9064的博客

06-24

4658

本文利用tensorflow已有api实现了一个简易的Transformer，易于读者通过代码理解Transformer的思想，其中数据集预处理及测试照搬官方教程的代码。

Transformers 快速入门 | 一

TensorFlowNews

03-17

5132

作者|huggingface 编译|VK 来源|Github 理念 Transformers是一个为NLP的研究人员寻求使用/研究/扩展大型Transformers模型的库。该库的设计有两个强烈的目标: 尽可能简单和快速使用: 我们尽可能限制了要学习的面向对象抽象的类的数量，实际上几乎没有抽象，每个模型只需要使用三个标准类:配置、模型和tokenizer，所有这些类都可以通过使用公共的fro...

Hugging Face 的 Transformers 库快速入门（三）必要的 Pytorch 知识

liu_chengwei的博客

10-22

2326

在上一篇《模型与分词器》中，我们介绍了Model类和Tokenizers类，尤其是如何运用分词器对文本进行预处理。Transformers 库建立在 Pytorch 框架之上（Tensorflow 的版本功能并不完善），虽然官方宣称使用 Transformers 库并不需要掌握 Pytorch 知识，但是实际上我们还是需要通过 Pytorch 的DataLoader类来加载数据、使用 Pytorch 的优化器对模型参数进行调整等等。

第四章:Transformer经典案例

06-01

893

学习了什么是语言模型:以一个符合语言规律的序列为输入，模型将利用序列间关系等特征，输出一个在所有词汇上的概率分布.这样的模型称为语言模型.学习了语言模型能解决哪些问题:1, 根据语言模型的定义，可以在它的基础上完成机器翻译，文本生成等任务，因为我们通过最后输出的概率分布来预测下一个词汇是什么.2, 语言模型可以判断输入的序列是否为一句完整的话，因为我们可以根据输出的概率分布查看最大概率是否落在句子结束符上，来判断完整性.

简单的Transformer模型手算示例

星宇_大佬养成时的博客

05-21

1285

通过这个手算示例，我们展示了Transformer模型使用三头注意力机制、每个注意力头的维数为4，隐藏层维度为5的前向传播、计算损失和反向传播的基本过程。为了简化计算，我们对注意力计算和softmax进行了近似处理。实际应用中，Transformer模型的计算会复杂得多，但基本原理是相同的。这个例子有助于理解Transformer模型的基本工作机制和训练过程。

Transformer代码实战

发呆的比目鱼的博客

07-22

1908

Transformer代码实战

Transformer训练例子

lwaif的专栏

04-21

850

定义数据加载器和损失函数。# 定义优化器和学习率调度器。# 转换为Tensor类型。# 创建模型和数据集。

Transformer（self attention）超详解&示例代码

热门推荐

weixin_39228381的博客

09-28

1万+

说明 attention机制（注意力机制）有效解决了RNN网络对长序列编码效果差的问题。但是attention机制是对RNN网络编码后的特征序列进行打分，如果输入序列长度是30（即输入30个连续的原始特征），则RNN网络会编码出30个编码后的特征。在解码时，每解码一次，都会对这30个编码后的特征进行打分求和，结果作为输入传给解码器。既然每次都是对全部编码后的特征进行打分，即每次解码都使用了全部信息，那么可不可以不使用编码后的特征，直接对原始特征进行打分呢，答案是可以的，即self attention。

Transformers 示例 | 六

TensorFlowNews

03-30

2624

作者|huggingface 编译|VK 来源|Github 在本节中，将结合一些示例。所有这些示例都适用于多种模型，并利用了不同模型之间非常相似的API。重要：要运行示例的最新版本，你必须从源代码安装并为示例安装一些特定要求。在新的虚拟环境中执行以下步骤： git clone https://github.com/huggingface/transformers cd transforme...

Transformer处理文本分类实例(Pytorch)

qq_37293230的博客

07-31

1447

数据格式如下, csv格式,分别为: 分类,标题,描述AG News数据集包含四个主要的类别：1->世界（World）、2->体育（Sports）、3->商业（Business）,4->科技（Sci/Tech）。每个类别包含30,000个训练样本和1,900个测试样本，总共120,000个训练样本和7,600个测试样本。

Transformer实战

Beyourself

07-26

9750

引言：Transformer自从2017年提出到现在，已经被广泛应用于NLP各项任务中，尤其是NMT，取得的效果最明显。前面讲了Transformer模型，下面就来介绍一下Transformer实战。已经有很多大神写了Transformer的各种实现，本文参考的是哈佛大学2018年4月的一个实现版本。与以往纯翻译的博客不同，本文侧重整体结构+细节分析，并附上了很多模型局部图以及类的依赖关系图，解...

【NLP9-Transformer经典案例】

weixin_34280060的博客

03-18

823

其中包括的语料有：用于情感分析的SST和IMDB，用于问题分类TREC，用于及其翻译的WMT14，IWSLT,以及用于语言模型任务wikiText-2。语言模型本身的训练目标是预测下一个词，因为它的特征提取部分会抽象很多语言序列之间的关系，这些关系可能同样对其它语言类任务有效果。以一个符合语言规律的序列为输入，模型将利用序列间关系等特征，输出在一个在所有词汇上的概率分布，这样的模型称为语言模型。对文本数据进行处理，比如文本语料加载，文本迭代器构建等。torchtext重要功能。4、构建训练和评估函数。

Transformers是厂家吗？还是框架

02-22

<think>好的，用户问“Transformers是厂家吗？还是框架”，需要详细分析。首先，用户可能对Transformers这个词有混淆，可能听说过但不确定具体指什么。需要确定Transformers在这里指的是什么。首先，Transformers在技术领域最常见的是指Google在2017年提出的Transformer模型架构，广泛应用于NLP任务，如BERT、GPT等。但用户可能也联想到Hugging Face的Transformers库，这是一个流行的开源库，提供了预训练模型和工具，方便开发者使用。另外，用户提到“厂家”，可能误解Transformers是某个公司的名称。需要澄清Transformers不是厂家，而是技术术语或框架名称。还要考虑用户可能的背景，可能是刚接触NLP或机器学习，对术语不熟悉，需要简单明了的解释。接下来，要区分Transformer架构和Hugging Face的Transformers库。Transformer是模型架构，而Transformers库是基于该架构实现的工具。用户可能在使用某个模型（如nomic-embed-text）时遇到问题，或者想了解相关工具，所以需要明确两者的区别和应用场景。还要检查是否有其他可能的解释，比如是否有公司名为Transformers，但通常知名的是玩具公司“变形金刚”（Transformers），但显然与技术无关。因此用户的问题应该集中在技术领域。回答时需要先明确Transformers不是厂家，而是指架构或库。然后分别解释两者的定义、作用、应用场景，以及它们之间的关系。最后，可能需要给出使用建议或示例，帮助用户理解如何应用这些工具。需要确保语言简洁，避免技术 jargon，适合刚入门的用户理解。同时，结合用户之前的问题（关于表格嵌入模型），可能用户在处理具体项目时遇到困惑，需要明确工具和框架的选择，因此可以适当关联之前的建议，比如Hugging Face的Transformers库中的模型如TAPAS等。总结回答结构：首先回答问题（不是厂家，是架构或库），然后分点详细解释Transformer架构和Transformers库，最后总结区别和推荐资源。这样用户能清晰理解两者区别及应用。</think>**Transformers 既不是厂家，也不是一个传统意义上的“框架”**，而是指两种不同但相关的概念： --- ### **一、Transformer 架构（核心模型结构）** - **定义**： Transformer 是 **一种深度学习模型架构**，最初由 Google 团队在 2017 年的论文《Attention Is All You Need》中提出。它彻底改变了自然语言处理（NLP）领域，取代了传统的 RNN 和 CNN 模型。 - **核心特点**：通过 **自注意力机制（Self-Attention）** 捕捉序列数据（如文本）中长距离的依赖关系，支持并行计算，训练效率更高。 - **应用场景**： - 文本生成（如 ChatGPT、GPT-4） - 机器翻译、文本摘要 - 预训练模型（如 BERT、T5、PaLM）的基础架构。 --- ### **二、Hugging Face Transformers（开源库）** - **定义**： Hugging Face 公司开发的 **开源 Python 库**（库名即 `transformers`），提供大量基于 Transformer 架构的预训练模型和工具，简化了 NLP 任务的开发流程。 - **核心功能**： - 支持 100+ 种预训练模型（如 BERT、GPT-2、T5、TAPAS）。 - 提供统一的 API，支持文本分类、问答、生成等任务。 - 支持 PyTorch 和 TensorFlow 框架。 - **典型代码示例**： ```python from transformers import pipeline # 使用预训练模型进行文本分类 classifier = pipeline("text-classification") result = classifier("这个电影太好看了！") print(result) # 输出情感分析结果（如正面/负面） ``` --- ### **三、两者的关系** | 对比项 | Transformer 架构 | Hugging Face Transformers 库 | |----------------|------------------------------------------|---------------------------------------| | **本质** | 模型设计理论（如数学结构） | 基于该理论的具体代码实现和工具包 | | **开发者** | Google 团队（论文作者） | Hugging Face 公司 | | **用途** | 指导模型如何设计 | 直接调用现成模型解决实际问题 | | **依赖关系** | 无需安装，是一种设计思想 | 需通过 `pip install transformers` 安装 | --- ### **四、常见误解澄清** 1. **“Transformer 是厂家吗？”** - 不是。Hugging Face 是一家公司（可视为“厂家”），而 Transformer 是模型架构，`transformers` 是该公司维护的库。 2. **“Transformers 是框架吗？”** - 不是传统框架（如 PyTorch、TensorFlow），而是一个 **高层工具库**，依赖底层框架运行。 3. **变形金刚（玩具/电影）？** - 英文同名但无关！技术领域的 Transformer 与影视 IP《变形金刚》（Transformers）无任何关联。 --- ### **五、实际应用建议** - **如果你想训练模型**：学习 Transformer 架构的原理（如注意力机制、位置编码）。 - **如果你想快速开发 NLP 应用**：直接使用 Hugging Face 的 `transformers` 库，调用现成模型。 - **资源推荐**： - 库文档：[Hugging Face Transformers](https://huggingface.co/docs/transformers) - 实践教程：[Hugging Face 官方课程](https://huggingface.co/learn) 如果需要进一步解释某个方向（如 Transformer 的原理或库的使用技巧），可以随时告诉我！