text-classification 和 zero-shot-classification 区别

最新推荐文章于 2025-05-15 23:01:36 发布

原创

最新推荐文章于 2025-05-15 23:01:36 发布 · 536 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #机器学习

text-classification 和 zero-shot-classification 都是文本分类任务，但它们在处理方式和使用场景上有所不同。以下是它们的主要区别：

1. `text-classification`（文本分类）

text-classification 是一种经典的文本分类任务，要求对每个文本样本进行分类，并且文本类别是事先定义好的。该方法通常需要一个 已训练的分类模型，并且模型已经接收了与任务相关的标签（类别）。在这个任务中，模型根据已经训练的标签集合对输入的文本进行分类。

特点：

有标签训练：你需要训练一个分类模型（例如，BERT、RoBERTa、MacBERT 等），该模型需要在带标签的数据上进行微调。分类标签是 固定的，即预定义好的类别。
训练：模型通过大量带标签的数据学习这些类别。需要微调模型以适应特定的任务。
适用场景：适用于目标类别固定的场景，如情感分析、新闻分类、意图分类等。

示例：

假设你有一个带有多个类别的文本分类任务，比如意图分类：

from transformers import pipeline

# 使用预训练的文本分类模型
classifier = pipeline("text-classification", model="bert-base-chinese")

# 输入文本
texts = ["我想预定酒店", "今天的天气怎么样？", "如何退货"]

# 分类
results = classifier(texts)
print(results)

在这种情况下，模型已经训练过，并且它能够基于训练的类别来对输入文本进行分类。