1、学习了一篇骗子用大数据精准诈骗的文章,基本上用到的还是信用模型的方法,只是特征选择中有一个最大信息熵方法,我不是太明白,其他的用iv或者用卡方检验来筛特征、还有SAS中用到的向前选择、向后选择、逐步选择,最后文章中的案例还是用woe、iv的方法,选出了5个比较不错的特征,这种相当于是信用模型方法的另一个应用!
2、中午研究了一下五险一金的东西,都是上了2年班的人,其实还没深入了解到五险一金的规则,其实也简单,最多一天就能搞透彻,有些地方性的差异需要去询问相关人士
3、还和tony讨论了很久,解答他的疑问,给他抓取了一些数据,对于止付和冻结再一次讨论,tony说为什么内陆银行结清了,还不给解冻,但是我去论坛看了下很多这种结清了,银行仍然冻结和止付,而且也不会销卡,就这样挂起。抓取了一些逾期和表现相关数据
4、整理完了表现的SQL,但对已知的错误并来得及修正
本文探讨了大数据在信用模型中的应用,重点介绍了最大信息熵方法用于特征选择的过程,并通过实例展示了如何利用WOE和IV筛选出关键特征。此外,文中还提到了与银行止付和冻结相关的问题以及对五险一金的初步了解。
200

被折叠的 条评论
为什么被折叠?



