本文是LLM系列文章,针对《Large Language Model based Situational Dialogues for Second Language Learning》的翻译。
摘要
在第二语言学习中,基于情景的会话练习对于语言学习者实现口语流利性很重要,但学生往往缺乏足够的机会与合格的教师或母语人士一起练习会话技能。为了弥补这一差距,我们提出了情景对话模型,供学生进行对话练习。我们的情景对话模型在大型语言模型(LLM)的基础上进行了微调,目的是将开放式对话的引人入胜的性质与基于场景的任务的集中实践相结合。利用LLM的泛化能力,我们证明了我们的情景对话模型不仅在训练主题上有效,而且在训练中未遇到的主题上也有效。这提供了一个很有前途的解决方案,可以在不需要大量手动工作的情况下支持广泛的对话主题。此外,对话系统领域的研究仍然缺乏可靠的自动评估指标,导致人类评估成为黄金标准,这通常是昂贵的。为了解决现有评估方法的局限性,我们提出了一种新的自动评估方法,该方法采用微调的LLM来有效评估情景对话模型的性能。
1 引言
2 相关工作
3 数据生成
4 对话模型
5 评估
6 结论
在这项工作中,我们介绍了一种基于微调LLM的情景对话方法,以提高学习第二语言的学生的会话技能。为了进行评估,我们采用了三个指标:响应成功率、建议成功率和会

订阅专栏 解锁全文
649

被折叠的 条评论
为什么被折叠?



