16、文本摘要与问答系统:模型评估与应用探索

文本摘要与问答系统:模型评估与应用探索

文本摘要模型评估与生成

在文本摘要任务中,模型的评估至关重要。通过计算 ROUGE 分数,我们可以直观地了解模型的性能。以下是计算 ROUGE 分数并创建 DataFrame 的代码:

rouge_dict = dict((rn, score[rn].mid.fmeasure) for rn in rouge_names)
pd.DataFrame(rouge_dict, index=[f"pegasus"])

得到的结果如下:
| | rouge1 | rouge2 | rougeL | rougeLsum |
| — | — | — | — | — |
| pegasus | 0.427614 | 0.200571 | 0.340648 | 0.340738 |

从这些 ROUGE 分数可以看出,经过微调的模型相比未微调的模型有了显著提升。这表明之前的模型虽然也经过了摘要任务的训练,但并不完全适用于新的领域。接下来,我们可以将训练好的模型推送到 Hub:

trainer.push_to_hub("Training complete!")

在训练过程中,我们还可以对生成的内容进行评估。具体操作步骤如下:
1. 使用 Seq2SeqTrainingArguments 扩展 TrainingArguments ,并指定

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值