题目
基尼不纯度是一种衡量分类模型性能的指标,常用于决策树的剪枝。其计算公式为:
G
i
n
i
=
1
−
∑
i
=
1
n
p
i
2
Gini = 1 - \sum_{i=1}^{n} p_i^2
Gini=1−i=1∑npi2
其中,
p
i
p_i
pi 是每个类别的概率。
标准代码如下
def gini_impurity(y: list[int]) -> float:
classes = set(y)
n = len(y)
gini_impurity = 0
for cls in classes:
gini_impurity += (y.count(cls)/n)**2
return round(1-gini_impurity,3)
959

被折叠的 条评论
为什么被折叠?



