题目
BloomLLM:基于大型语言模型的问题生成,结合监督微调和布鲁姆分类法
论文地址:https://dl.acm.org/doi/10.1007/978-3-031-72312-4_11
项目地址:https://github.com/duongtrung/BloomLLM
摘要
自适应评估具有挑战性,而考虑各种能力水平及其关系则使其变得更加复杂。然而,人工智能 (AI) 的最新发展为解决这些相关问题提供了新方法。在本文中,我们介绍了 BloomLLM,这是大型语言模型 (LLM) 的一种新改编,专门设计用于根据布鲁姆修订分类法增强教育内容的生成。BloomLLM 通过提供有意义的、语义上相关的问题,在所有能力水平上都表现良好。它是通过解决基础 LLM 的挑战来实现的,例如缺乏层次的语义相互依赖性和幻觉增加,这通常会导致不切实际和不切实际的问题。BloomLLM 在 ChatGPT-3.5-turbo 上进行了微调,是在 2023 年冬季学期对两门硕士课程中涉及 29 个主题的 1026 个问题进行微调后开发的。该模型的性能超过了 ChatGPT-4,即使采用不同的提示策略,也标志着生成式人工智能在教育中的应用取得了重大进步。我们已公开提供 BloomLLM 代码和训练数据集,以提高透明度和可重复性。
关键词:Bloom 修订分类法 · BloomLLM · ChatGPT · 监督微调 · LLM