学习模型预测性能对比:IRT与贝叶斯模型
1. 引言
在智能学习环境中,评估学习者对一组技能的掌握程度是一个关键问题。许多自适应应用需要一个学习者模型来评估学生的技能,以便根据用户的情况对学习环境进行调整。技能通常是一种抽象的、无法直接测量的潜在特质,它会影响学习者在测试或练习中的表现。
本文探讨了两种创建技能抽象模型的方法:
- 方法一 :将技能直接整合到包含可观察数据项(如练习或测试项目)的领域模型中。常见的是构建技能层次结构,可观察项位于底层,通常用贝叶斯网络或其混合衍生模型表示。通过概率推理算法,可以根据观察到的项目推断技能掌握的概率。
- 方法二 :使用Q矩阵,它定义了每个测试项目与技能的关联。通过学生的项目响应结果向量与Q矩阵的点积,可以计算学生的技能掌握情况。如果学生项目结果矩阵包含掌握概率,那么技能评估就是概率性的。
选择基于可观察数据项构建模型(item-to-item)还是包含潜在技能的模型(如贝叶斯网络),需要综合考虑知识工程工作量、计算复杂度以及预测的可靠性和准确性等因素。本文将比较基于标准贝叶斯建模算法的三种item-to-item模型(朴素贝叶斯、树增强朴素贝叶斯TAN和K2贝叶斯分类器)与广泛使用的包含单一潜在技能的IRT - 2PL方法的预测性能。
2. 单一潜在特质模型:项目反应理论(IRT)
项目反应理论(IRT)模型是心理测量学中研究最多的模型,常用于计算机自适应测试。该模型假设测试中所有项目的成功与否由单一技能θ(潜在特质)决定。
在IRT的两参数版本中,单个项目Xi成功的概率由逻辑
超级会员免费看
订阅专栏 解锁全文
35

被折叠的 条评论
为什么被折叠?



