6、决策树、随机森林与机器学习在风险预测中的应用

决策树、随机森林与机器学习在风险预测中的应用

1. 决策树与随机森林在企业违约预测中的应用

1.1 数据来源与研究对象

研究聚焦于中小企业(SME)的违约预测,数据源自Bureau Van Dijk的AIDA数据库。选取意大利东北部地区(威尼托、特伦蒂诺 - 上阿迪杰和弗留利 - 威尼斯朱利亚)在2018年或2019年公布最后财务报表的109,836家企业。这些地区是新冠疫情封锁后首批计划并开始重新开放的地区,对脆弱企业及其脆弱性决定因素的分析,对于研究早期预警指标和制定正确政策干预至关重要。

1.2 变量设定与数据处理

  • 响应变量 :企业的法律状态,分为“违约(Default)”和“活跃(Active)”两类。“违约”类别包括所有已宣布破产、资不抵债或处于接管程序的企业。
  • 输入变量 :共104个,包括公司的一些显著特征、财务报表以及主要财务和盈利能力比率。
  • 缺失值处理 :通过接近度度量(Breiman, 2003)估计缺失值。
  • 样本不平衡问题 :在109,836家企业中,只有689家被归类为“违约”,样本存在严重不平衡。为减少“违约”案例的误分类率,对多数类(活跃企业)进行随机欠采样。

1.3 随机森林模型构建

构建了两个不同训练集大小和组成的随机森林模型:
- 模型一 :训练集大小为10,344,其中活跃企业10

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值