Torch SimpleTransformers

本文介绍了如何使用Torch SimpleTransformers进行模型训练的可视化、早期停止策略、自定义评估指标、Simple Viewer应用以及超参数优化。通过Weights&Biases库进行模型可视化,利用早停策略防止过拟合,自定义评估函数实现sklearn格式的评估,使用Simple Viewer展示模型预测结果,最后探讨了如何进行超参数优化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Torch SimpleTransformers包

  1. 可视化支持 Visualization support
    可以使用 Weights&Biases 一种模型可视化库,来对模型训练进行可视化

只需要为模型的args属性中,给字典里的’wandb_project’ 设置一个属性名称
model = ClassificationModel(‘roberta’, ‘roberta-base’, args={‘wandb_project’: ‘project-name’})

  1. 提早停止训练 Early stopping
    Early stopping 是一种防止模型过拟合的技术。简单来说,就是周期性的评估一个模型在测试集上的性能,当模型不在测试集上有性能提升就停止训练。

可以通过模型的参数设置来调整相应的early stopping条件
(early_stopping_consider_epochs,
early_stopping_delta,
early_stopping_metric,
early_stopping_metric_minimize,
early_stopping_patience)
要使用early stopping就必须设置use_early_stopping 为True

以下设置的含义是:模型训练会在如下条件下停止:
每1000次做一次评估,模型连续5次在测试集上的mcc评估成绩没有比之前最好的mcc成绩提升0.01
from simpletransformers.classification import ClassificationModel, ClassificationArgs

model_args = ClassificationArgs()
model_args.use_early_stopping = True
model_args.early_stopping_delta = 0.01
model_args.early_stopping_metric = “mcc” #马修斯相关系数,二分类的一种评价指标,取值在[-1,1]之间,值越大分类越精确
model_args.early_stopping_metric_minimize = False
model_args.early_stopping_patience = 5
model_args.evaluate_during_training_steps = 1000

model = ClassficationModel(“bert”, “bert-base-cased”, args=model_args)

3.其他模型评估指标 Additional Evaluation Metrics
Simple Transformers根据所选的特定模型,都会有个默认的评估指标,用于计算模型在数据集上的性能。
然而有时候,需要根据自己的实际用例来调整评估指标。
因此,eval_model()和train_model() 方法接受关键字参数来设置评估函数,评估函数必须接受2种输入(True label, Prediction),跟sklearn的格

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值