本文是LLM系列文章,针对《LLM vs Small Model? Large Language Model Based Text Augmentation Enhanced Personality Detection Model》的翻译。
摘要
个性检测旨在检测社交媒体帖子中潜在的个性特征。这项任务的一个挑战是缺乏从自我报告问卷中收集的基本事实人格特征。大多数现有的方法都是在有限的个性标签的监督下,通过微调预训练的语言模型来直接学习帖子特征。这导致帖子特征的质量较差,从而影响性能。此外,他们将人格特征视为一个热门的分类标签,忽略了其中的语义信息。在本文中,我们提出了一种基于大语言模型(LLM)的文本增强型人格检测模型,该模型提取LLM的知识来增强用于人格检测的小模型,即使LLM在该任务中失败。具体来说,我们使LLM能够从语义、情感和语言方面生成后分析(增强),这对个性检测至关重要。通过使用对比学习在嵌入空间中将它们拉到一起,后编码器可以更好地捕捉后表示中的心理语言信息,从而提高个性检测。此外,我们利用LLM来丰富个性标签的信息,以提高检测性能。在基准数据集上的实验结果表明,我们的模型在个性检测方面优于最先进的方法。