1、上午涉及到几天的小结,所以差不多用了一个上午的时间,小结中确定了早睡的督促办法
2、做员工贷的逻辑,没什么新东西,写了新的逻辑
3、尝试了7C的最大授信逻辑,但是有一些问题,搁置了
4、然后就是同盾的在网时长改版的问题
5、晚上主要是做标准评分卡的工具包,主要解决几个问题,一个是离散化的问题,离散化只能按照去重后的value个数来,还有就是没写group数量太小,结果不稳定的问题,类似于最小sample数,可以多加这样一个参数,然后某些bin没有坏客户,这种需要regroup,昨天主要就是解决如何半自动地regroup的问题,全自动应该十分困难,半自动现在都暂时未能解决,主要就是筛选赋值的问题,series也可以用[]进行筛选,比如
df['CRDT_LOANEE_1M'][(df['CRDT_LOANEE_1M'] >= 3) & (df['CRDT_LOANEE_1M'] <= 8)]这种方式可以筛选,但是如果直接赋值存在问题,一个是有个warning,二的个是很奇怪,我后面的程序输出受到了影响,现在还需要看一下!

本文总结了一天的工作内容,包括员工贷逻辑更新、7C最大授信逻辑尝试、同盾在网时长改版等问题,并详细介绍了标准评分卡工具包的研发过程,特别是离散化处理、半自动regroup等关键步骤。
244

被折叠的 条评论
为什么被折叠?



