NLP 模型验证

混淆矩阵

在这里插入图片描述

准确率

在这里插入图片描述

召回率 精确率

召回率:在所有正样本中,被预测为正样本的个数
精确率:在预测为正样本中,真正的正样本
在这里插入图片描述

F1-score

在这里插入图片描述

G-mean(样本不平衡之下的评价指标)

在这里插入图片描述

ROC-AUC

在这里插入图片描述ROC空间将伪阳性率(FPR)定义为 X 轴,真阳性率(TPR)定义为 Y 轴

PR-AUC

在这里插入图片描述

ROC 和 PR的区别

在这里插入图片描述

偏差 方差

偏差:算法在训练集上的错误率
偏差提现的是模型的偏离程度

方差:算法在开发集上的错误率 - 算法在训练集上的错误率
方差提现的是模型的离散程度,也就是稳定性

偏差的继续分解

偏差 = ‘不可避免偏差’(即最优错误率) + ‘不可避免偏差’

减少可避免偏差的技术

  1. 加大模型规模
  2. 根据误差分析结果修改输入特征
  3. 减少或者去除正则化(L1正则化,L2正则化,dropout)
  4. 修改模型构架

减少方差的技术

  1. 添加更多的数据
  2. 加入正则化
  3. 加入提前终止
  4. 通过特征选择减少输入特征的数量和种类
  5. 减少模型规模
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值