随机森林剪枝与空间数据集热点发现
1. 随机森林剪枝
在随机森林的应用中,为了在不影响泛化目标的前提下对其进行剪枝,采用了一种独特的方法。首先,收集每个经典随机森林(CRF)的一系列统计信息,这些信息涵盖了分类的准确性、成本、复杂度等多个方面,具体统计项如下表所示:
|统计项|描述|
| ---- | ---- |
|Correct Classification Count|正确分类的数量|
|Correct Classification Percentage|正确分类的百分比|
|Incorrect Classification Count|错误分类的数量|
|Incorrect Classification Percent|错误分类的百分比|
|Kappa statistic|Kappa统计量|
|Total Cost|总成本|
|Average Cost|平均成本|
|Relative Info Score|相对信息得分|
|Info Score bits|信息得分比特数|
|Info Score bits per instance|每个实例的信息得分比特数|
|Correlation coefficient|相关系数|
|Class complexity order 0 bits|0阶类复杂度比特数|
|Class complexity order 0 bits per instance|每个实例的0阶类复杂度比特数|
|Class complexity scheme bits|类复杂度方案比特数|
|Class complexity sche
超级会员免费看
订阅专栏 解锁全文
1047

被折叠的 条评论
为什么被折叠?



