遥感影像分类精度评估与决策树分类器详解
1. 评估地图精度所需的测试样本数量
在评估专题地图的精度时,选择合适数量的测试像素至关重要。若每类选取的样本过少,会导致对地图精度的估计不准确。例如,从某一特定类别中仅选取一个测试样本,其结果只能表明精度为 100% 或 0%,这显然难以准确反映地图的真实精度。而增加样本数量则能得到更接近实际的估计。
为了确定地图精度,我们需要从地图中随机选取测试像素。每个像素的标签只有正确或错误两种情况,其概率符合二项分布。设专题地图的总像素数为 $N$,第 $i$ 个像素的属性 $y_i$ ,若像素标签正确则 $y_i = 1$,错误则 $y_i = 0$。那么,正确标签像素的总数为 $\sum_{i = 1}^{N}y_i$,地图的整体精度 $P$ 可表示为:
$P = \frac{1}{N}\sum_{i = 1}^{N}y_i$
对于测试集,设总像素数为 $n$($n \leq N$),第 $j$ 个测试集像素的属性为 $g_j$,若检测到地图中像素标签正确则 $g_j = 1$,错误则 $g_j = 0$。测试集中正确标签像素的总数为 $\sum_{j = 1}^{n}g_j$,测试集估计的地图精度 $p$ 为:
$p = \frac{1}{n}\sum_{j = 1}^{n}g_j$
我们的目标是找到合适的 $n$ 值,使 $p$ 能较好地估计 $P$。$p$ 的期望 $E(p) = P$,其方差 $var(p)$ 为:
$var(p) = \frac{P(1 - P)}{n}\frac{(N - n)}{(N - 1)}$
当 $N \gg n$ 时,方差可简化为: <
超级会员免费看
订阅专栏 解锁全文
8515

被折叠的 条评论
为什么被折叠?



