本文为 「茶桁的 AI 秘籍 - BI 篇 第 08 篇」

Hi, 你好。我是茶桁。
课程回顾
上节课,咱们讲了一个股票的指标:MACD。在趋势行情里面它应该还是有效的指标。它比较忌讳动荡行情,比如说它一会上升一会下降,那还没有等 12 天过完,就是均线还没有画好它又马上变成了另一个行线,这样 MACD 有可能会失效。
这个问题我们大家自己去思考一下,如果你采用这个策略在过去一段时间里面选择一些股票来进行购买的话,能不能让它的收益率大于 60%?有这种可能性,选好股的话确实在过去一年交易里面收益率是有可能大于 60%。
那我们之前的课程里,带来了 Fintech 的应用场景,同时又对其中一个量化交易的场景做了一个简单实验。今天,咱们来另一个 Fintech 的场景,同样也是有数据,这个数据是来自于一场比赛。
这个比赛是关于贷款违约预测的一个比赛,来,我们一起回想一下,在这个 BI 系列课程开始的几节课里咱们讲的模型、机器学习的神器。大家还记得是哪两个神器吗?其实严格来说的话应该是三个神器。
XGBoost 是第一个,LightGBM 是更快的,还有一个是跟分类相关的 CatBoost。
案例分析
接下来,我们来看一个问题:
零基础入门金融风控-贷款违约预测
这里有 47 个指标,120 万贷款记录。其中 15 列为匿名变量,并且对 employmentTitle、purpose、postCode 和 title 等字段进行了脱敏。
给你两个数据集, 一个是训练集,一个是测试集:

订阅专栏 解锁全文

1万+

被折叠的 条评论
为什么被折叠?



