逻辑回归是用于分类任务的监督 机器学习技术之一。大多数情况下,分类数据集会出现类别不平衡,某个类别的样本较多,而某些类别的样本数量非常少。使用不平衡的数据集进行模型构建会导致错误的预测,并且对具有更多样本的类更有利。了解类权重在逻辑回归中的重要性,以及为什么需要平衡类权重才能产生可靠的模型。
1、分类权重
类权重是用于分类任务的术语,其中数据集的每个类别将根据每个类别的出现频率提供一定的权重。因此类权重将负责为梯度更新的所有类别赋予相等的权重。使用不平衡的类别权重将导致偏向数据中出现最多的类别。为了获得更可靠和无偏的分类模型,重要的是要有均匀的类权重分布。类权重的均匀分布也将产生各种参数,如精度、召回率和 F1 分数,因为类权重将被平衡。
与不平衡类权重相关的主要问题是准确性。对于不平衡类权重,产生的准确度通常会很高,因为它会偏向于出现最多的类,因为它会考虑更高的类权重。
假设正在使用医疗保健数据或业务驱动的数据,并且类别权重不平衡。因此,如果不解决数据中的类别不平衡问题,则会导致模型的误解。此外,某些参数ÿ