2×2列联表的统计分析与应用
在数据分析和医学诊断等领域,2×2列联表是一种常用的工具,它能帮助我们对数据进行分类和分析。下面将详细介绍2×2列联表的相关概念,包括边际总数、边际概率、预测试赔率、I型和II型错误,以及校准和不确定测试结果的处理方法,最后还会提及列联表衍生指标的计算和置信区间的重要性。
1. 边际总数与边际概率
在2×2列联表中,通过不同方向的求和可以得到六个边际总数,这些总数用小写字母表示。同时,将这些边际总数除以总数N,就可以得到相应的边际概率,用大写字母表示。
1.1 边际总数
- 垂直方向 :
- (p = TP + FN = a + c),表示正例的数量。
- (p′ = FP + TN = b + d),表示负例的数量。
- (p + p′ = N),即正例和负例的总数等于样本总数。
当(p = p′)时,数据集是平衡的;否则,就存在类别不平衡的问题,这可能会影响从2×2列联表中得出的一些指标的有效性。
- 水平方向 :
- (q = TP + FP = a + b),表示正分类的数量。
- (q′ = FN + TN = c + d),表示负分类的数量。
- (q + q′ = N)。
- 对角线方向 :
- (r = TP
超级会员免费看
订阅专栏 解锁全文
2810

被折叠的 条评论
为什么被折叠?



