NLP论文速读(EMNLP 2024)|增强语言模型一致性:一种基于置信度的标签平滑方法Enhancing Language Model Alignment: A Confidence-Base ……
本文通过理论分析,揭示了标签平滑参数与置信度的关系,并提出了一种新的方法,即置信度感知标签平滑(Confidence Aware Label Smoothing, CALS),以期在训练动态和均衡中实现更稳定和保守的梯度更新,从而提高模型与人类偏好的对齐度。在CALS中,梯度更新既考虑了偏好标签的置信度,也考虑了模型预测的正确性。这些结果表明,CALS方法在逻辑回归任务中能够有效地提高模型的泛化能力,并且在不同的维度设置下都能保持较低的测试损失,证明了CALS方法在提高模型与人类偏好对齐方面的潜力。
原创
2024-12-30 04:00:00 ·
814 阅读 ·
0 评论