本文是LLM系列文章,针对《CrisisSense-LLM: Instruction Fine-Tuned Large Language Model for Multilabel Social Media Text Classification in Disaster Informatics》的翻译。
摘要
在危机/灾害信息学领域,社交媒体正越来越多地用于提高态势感知,为应对和救援工作提供信息。高效准确的文本分类工具一直是危机信息学研究的重点领域。然而,目前的方法大多依赖于单标签文本分类模型,无法捕捉到动态和多方面的灾害相关社交媒体数据中嵌入的不同见解。本研究介绍了一种新的灾难文本分类方法,通过针对灾难相关推文的多标签分类进行指令微调来增强预训练的大型语言模型(LLM)。我们的方法涉及从与灾难相关的推文中创建一个全面的指令数据集,然后使用该数据集对开源LLM进行微调,从而将其嵌入特定于灾难的知识中。这种微调模型可以同时对灾害相关信息的多个方面进行分类,如事件类型、信息含量和人类援助的参与程度,显著提高了社交媒体数据在灾害情境感知中的效用。结果表明,这种方法增强了社交媒体帖子中关键信息的分类,从而有助于在紧急情况下更有效地部署态势感知。这项研究为更先进、适应性更强、更稳健的灾害管理工具铺平了道路,利用LLM的能力来提高灾害场景中的实时态势感知和响应策略。
1 引言
2 LLM背景
3 方法
4 结果
5 结束语
从社交媒体自动提取情境信息是灾害信息学中社会感知的重要组成部分。通过克服单标签分类方法的局限性,本研究通过指令微调利用大语言模型(LLM)的多标签分类能力,在灾害信息学的文本分类领域取得了重大进展。我们的研究证明了特定领域模型可以在多大程度上提高社交媒体上灾害相关信息分类的准确性和效率,这对于及时有
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



