内容整理自百度百科
kappa系数是一种衡量分类精度的指标。
公式:
k
=
p
o
−
p
e
1
−
p
e
k=\frac{p_o-p_e}{1-p_e}
k=1−pepo−pe
其中,
p
o
p_o
po是每一类正确分类的样本数量之和除以总样本数,也就是总体分类精度 。C是类别总数,
T
i
T_i
Ti是每个类别被正确分类的样本数.假设每一类的真实样本个数分别为a1,a2,…,aC,而预测出来的每一类的样本个数分别为b1,b2,…,bC
总样本个数为n,
p
o
=
∑
i
=
1
C
T
i
n
p_o=\frac{\sum_{i=1}^{C}T_i}{n}
po=n∑i=1CTi
p e = ∑ i = 1 C a i ∗ b i n 2 p_e=\frac{\sum_{i=1}^{C}a_i*b_i}{n^2} pe=n2∑i=1Cai∗bi
实例
百度百科中提供了一个例子

Kappa系数是一种衡量分类准确性的重要统计量,它通过比较实际分类与随机分类的差异来评估分类器的性能。公式涉及总体分类精度(pop_o)和预期分类精度(p_e),其中pop_o是所有类别正确分类的样本比例,p_e是按样本分布随机分类的预期正确率。Kappa系数值越接近1,表示分类性能越好;接近0则表示分类效果与随机猜测相近。
9053





