现代心理测量学:测试特性与可靠性评估
在心理测量学领域,测试的设计和评估至关重要。本文将深入探讨测试的相关特性,包括项目反应理论、可靠性和有效性等关键概念,以及它们在实际应用中的重要性和操作方法。
1. 项目反应理论(IRT)
项目反应理论在测试中起着关键作用。在测试过程中,当一个项目呈现给受访者并得到回应后,系统会计算从题库中选择下一个项目,以获取最大信息。受访者的分数是基于对已呈现项目的综合概率计算得出的最可能能力的持续计算。随着更多项目的呈现,这种估计会变得更加准确,一旦达到预定的精度水平,测试就会终止。
IRT模型在比较不同难度水平测试的受访者分数方面非常有用。例如,当需要将同一考试系统的简单版本和较难版本(如英格兰和威尔士的GCSE)结合起来生成一组共同的分数时,IRT模型就可以发挥作用。这满足了公众在比较不同资格申请人时的需求。
此外,21世纪计算统计学的进步和软件的广泛应用,使得IRT方法不仅可以用于能力评估,还可以用于人格评估。如今,学术论文中使用这种方法的情况几乎每天都有出现。IRT模型还允许将其扩展到多变量和多响应数据,使我们能够研究不同响应类别的特征。
2. 测试的可靠性
可靠性是测试的重要特性之一,它指的是测试在多大程度上能够有效地测量到某些东西。如果一个测试不可靠,那么它就不可能有效,但一个可靠的测试不一定有效。以下是几种常见的可靠性评估方法:
- 重测信度(Test–retest reliability) :这是最直接的估计测试可靠性的方法,通过在一周左右的间隔内对同一组受访者进行两次测试,然后计算两次得分的皮尔逊积矩相关系数,得到可靠性系数
超级会员免费看
订阅专栏 解锁全文
1040

被折叠的 条评论
为什么被折叠?



