Torch SimpleTransformers_simpletransformers 过采样-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_45606671/article/details/120367336

本文介绍了如何使用Torch SimpleTransformers进行模型训练的可视化、早期停止策略、自定义评估指标、Simple Viewer应用以及超参数优化。通过Weights&Biases库进行模型可视化，利用早停策略防止过拟合，自定义评估函数实现sklearn格式的评估，使用Simple Viewer展示模型预测结果，最后探讨了如何进行超参数优化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Torch SimpleTransformers包

可视化支持 Visualization support
可以使用 Weights&Biases 一种模型可视化库，来对模型训练进行可视化

只需要为模型的args属性中，给字典里的’wandb_project’ 设置一个属性名称
model = ClassificationModel(‘roberta’, ‘roberta-base’, args={‘wandb_project’: ‘project-name’})

提早停止训练 Early stopping
Early stopping 是一种防止模型过拟合的技术。简单来说，就是周期性的评估一个模型在测试集上的性能，当模型不在测试集上有性能提升就停止训练。

可以通过模型的参数设置来调整相应的early stopping条件
(early_stopping_consider_epochs,
early_stopping_delta,
early_stopping_metric,
early_stopping_metric_minimize,
early_stopping_patience)
要使用early stopping就必须设置use_early_stopping 为True

以下设置的含义是：模型训练会在如下条件下停止：
每1000次做一次评估，模型连续5次在测试集上的mcc评估成绩没有比之前最好的mcc成绩提升0.01
from simpletransformers.classification import ClassificationModel, ClassificationArgs

model_args = ClassificationArgs()
model_args.use_early_stopping = True
model_args.early_stopping_delta = 0.01
model_args.early_stopping_metric = “mcc” #马修斯相关系数，二分类的一种评价指标，取值在[-1,1]之间，值越大分类越精确
model_args.early_stopping_metric_minimize = False
model_args.early_stopping_patience = 5
model_args.evaluate_during_training_steps = 1000

model = ClassficationModel(“bert”, “bert-base-cased”, args=model_args)

3.其他模型评估指标 Additional Evaluation Metrics
Simple Transformers根据所选的特定模型，都会有个默认的评估指标，用于计算模型在数据集上的性能。
然而有时候，需要根据自己的实际用例来调整评估指标。
因此，eval_model()和train_model() 方法接受关键字参数来设置评估函数，评估函数必须接受2种输入（True label, Prediction），跟sklearn的格