Transformers 开源项目使用教程-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00647/article/details/142200240

Transformers 开源项目使用教程

transformers An Android transformation library providing a variety of image transformations for Coil, Glide, Picasso, and Fresco. 项目地址: https://gitcode.com/gh_mirrors/tr/transformers

1. 项目介绍

Transformers 是一个由 Hugging Face 开发的开源库，提供了数千个预训练模型，用于处理文本、图像和音频等多种模态的数据。该项目的主要目标是简化预训练模型的下载、训练和使用，从而降低计算成本和时间，同时提高模型的性能。

Transformers 支持多种深度学习框架，包括 PyTorch、TensorFlow 和 JAX，用户可以根据需要在不同的框架之间无缝切换。此外，该项目还提供了丰富的 API 和工具，帮助用户快速上手并进行模型的微调和部署。

2. 项目快速启动

安装

首先，确保你已经安装了 Python 3.8 或更高版本。然后，你可以通过 pip 安装 Transformers 库：

pip install transformers

快速使用

以下是一个简单的示例，展示如何使用 Transformers 库进行情感分析：

from transformers import pipeline

# 创建一个情感分析的 pipeline
classifier = pipeline('sentiment-analysis')

# 对文本进行情感分析
result = classifier("我们非常高兴地介绍 pipeline 到 transformers 仓库。")
print(result)

输出结果将是一个包含情感标签和置信度的字典：

[{'label': 'POSITIVE', 'score': 0.9996980428695679}]

3. 应用案例和最佳实践

文本分类

Transformers 提供了多种预训练模型，适用于不同的文本分类任务。以下是一个使用 BERT 模型进行文本分类的示例：

from transformers import BertTokenizer, BertForSequenceClassification
import torch

# 加载预训练的 BERT 模型和 tokenizer
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
model = BertForSequenceClassification.from_pretrained('bert-base-uncased')

# 准备输入数据
inputs = tokenizer("Hello, my dog is cute", return_tensors="pt")

# 进行推理
with torch.no_grad():
    logits = model(**inputs).logits

# 获取预测结果
predicted_class_id = logits.argmax().item()
print(model.config.id2label[predicted_class_id])

图像分类

Transformers 还支持图像分类任务。以下是一个使用 ViT (Vision Transformer) 模型进行图像分类的示例：

from transformers import ViTFeatureExtractor, ViTForImageClassification
from PIL import Image
import requests

# 加载预训练的 ViT 模型和 feature extractor
feature_extractor = ViTFeatureExtractor.from_pretrained('google/vit-base-patch16-224')
model = ViTForImageClassification.from_pretrained('google/vit-base-patch16-224')

# 加载图像
url = 'http://images.cocodataset.org/val2017/000000039769.jpg'
image = Image.open(requests.get(url, stream=True).raw)

# 准备输入数据
inputs = feature_extractor(images=image, return_tensors="pt")

# 进行推理
with torch.no_grad():
    logits = model(**inputs).logits

# 获取预测结果
predicted_class_idx = logits.argmax(-1).item()
print("Predicted class:", model.config.id2label[predicted_class_idx])