决策树模型在城市土地覆盖分类中的应用与分析
1. 决策树模型对比
在城市土地覆盖分类中,使用了两种决策树模型进行分析。决策树模型 1 包含 33 个高度相关的预测变量,而决策树模型 2 则基于精心挑选的 8 个不相关的预测变量构建。
模型 1 虽然拥有更广泛的预测变量集,可能捕获更多信息,但相关变量的冗余会在分类过程中引入噪声,影响模型准确区分某些土地覆盖类型的能力。例如,它常将裸地和草地/开放区域误分类为建成区,这对城市规划和政策制定有重大影响,可能导致对城市扩张的高估或对绿地的低估。
模型 2 利用较少且不相关的预测变量,简化了决策过程,能基于最相关信息进行更精确区分,在土地覆盖图中对建成区的划分更准确。这体现了以数据为中心的方法在机器学习中的优势,通过深入理解数据进行特征选择,有效减少分类噪声,提高了土地覆盖映射的准确性。
2. 可解释机器学习方法分析
2.1 特征重要性
特征重要性衡量每个特征对模型预测准确性的贡献程度。
模型 1
模型 1 中,B2.2、B11.2 和 B12.2(雨季后期)是最重要的特征。然而,当预测变量高度相关时,变量重要性的衡量可能存在偏差。Sentinel - 2 波段之间的高相关性可能会夸大某些波段的重要性,导致模型选择次优的预测变量。因此,在解释这些特征重要性结果时需谨慎,可采取选择或设计新特征以减少冗余,或考虑对相关性不那么敏感的计算特征重要性的方法。
模型 2
模型 2 使用相关性较低的预测变量,对特征重要性的评估更可靠。Sentinel - 1 VV.3(旱季)是该模型最重要的特征,
超级会员免费看
订阅专栏 解锁全文
20

被折叠的 条评论
为什么被折叠?



