花式sql 信用模型 2016.06.22回顾

本文介绍了作者在处理逾期数据及信用模型方面的实践经验。上午的工作集中在提取客户贷款数据,并解决了数据查询的技术难题。下午则深入研究了一个信用评分模型,并对样本大小的重要性进行了探讨。

1、上午主要是帮tony拿一些逾期相关的数据,在新老客户的判别上我想写得完备一些,但是where的方法不能直接转换为group by查全部,后来我是通过先计算loans表中客户的贷款次数,然后再用所有的national_id去连接,没连到的就是0,这样也能输出全部national_id的以往贷款次数,也能输出全部account_id的贷款次数,对于多个account_id对应一个national_id的情况,有一个别扭的加和,然后再连接,问题也是不大的!
2、下午的时间主要就是研究tony的模型,以及对他的模型的一些问题探讨,我的理解就是信用模型这东西有一部分本身就是经验主义的,经验是需要积累的,tony太偏重于数据,但是我在想30个历史上有90天逾期的人的表现和1800个人的表现没差别,30个样本太小,有没有一个量化的指标,多少个才可以说样本足够大呢?
3、下午还处理了一些sb的突发事件

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值