高偏差、高方差、低精确率与低召回率、混淆矩阵

本文深入探讨了高偏差和高方差的概念,解释了模型欠拟合和过拟合的问题,并提出了通过划分训练集和测试集来调整模型。同时,详细阐述了精确率和召回率的含义,以新闻推荐为例进行了说明,指出通过调整概率临界值可以平衡两者。最后,提到了混淆矩阵在评估模型性能中的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


本文是个人理解

1.高偏差(high bias)与方差(high variance)

    偏差,可以理解为样本与模型预测结果的差距,可以使用平方差计算

    方差是样本y值与模型期望的差的平方和。

    模型对实验数据欠拟合(underfitting) 是会出现搞偏差,而过拟合(overfitting)会造成高方差

    解决方法:直接的方法是将实验数据一分为二:训练集和测试集。模型在训练集和测试集上都达到高正确率才说明偏差和方差都可以接受

                       增加体征的数量可以降低偏差;减少特征数量可以降低方差


2. 精确率(precision)与召回率(recall)

      ,  '真正' 与 '真负'总和中'真正'的比例。

     , 即 '真正' 与'假负'总和中真正的比例


     以新闻推荐举例。

      精确率可以理解为,所有推荐了的新闻中该推荐的新闻的比例。 比如,推荐了10篇新闻,其中8篇是应该推荐的

      召回率可以理解为,所有应该推荐的新闻中实际推荐了的新闻的比例。比如应该推荐10篇感兴趣的新闻,只推荐了其中的8篇。

      要平衡精确率和召回率,可以调节区分正负类别的概率临界值。 为提高精确率,可以提高概率临界值,使得正类别的判断更加

       保守;为了提高召回率,可以降低概率临界值,以增加正类别的数量

       

3. 混淆矩阵

   

机器学习人工智能领域),混淆矩confusionmatrix)是可
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值