随机森林输出特征重要程度

  1. 读取CSV文件,拿到特征名字
data = pd.read_csv('train.csv')
feature_names = data.columns[:-1] #特征名,最后一列是标签
  1. 定义一个决策树或者加载以训练的决策树
  2. 输出特征重要性
print('Features sorted by their score:')
# print(clf.feature_importances_) # 输出这个就可以得到特征重要性,但是只有数值,不具有可读性
print(sorted(zip(feature_names, map(lambda x:round(x,4), clf.feature_importances_)),key=lambda x: x[1],reverse=True))

示例:
Features sorted by their score:
[ (‘duration’, 0.4400), (‘bytes_out’, 0.2105), (‘issuer_fields’, 0.1228), (‘subject_fields’, 0.1200), (‘num_pkts_out’, 0.1067)]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值