- 博客(35)
- 收藏
- 关注
原创 sql里面按照某一列求历史累计最大值rows BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW
累计历史最大逾期天数指标计算
2024-01-15 10:39:37
688
1
原创 python中的魔法函数
可以简化日常工作的python中的魔法函数魔法函数,适用于所有IPython中的操作1. %lsmagic该魔法函数的作用为在,并且可以这条语句不得不说这是一个很强大的魔法函数,应用型比较强。他的作用是在a.py里面生成的数(或者说从sql里面读取的数据量比较大的数据时)先保存,然后,此时不必再去重新读取数据进行其他操作。需要注意的是读取的时候需要使用该魔法函数是用于,当你的代码块比较多且显示的数据也比较多时,可以用该魔法函数清除已经显示的代码块...
2022-06-07 15:19:53
1839
原创 python中的GLMResultsWrapper
文章目录1. 需求2.用法1. 需求在做项目时,源代码可能无法满足我们的业务需求,因此我们需要改变已有包中的某些函数,然后用自己的函数去覆盖它,从而得到符合项目需求的结果.在逻辑回归的风险模型中,主要用到的是GLMResultsWrapper进行覆盖。其中wrapper:包装器,从名字上可以理解为GLM结果的包装器,也就是GLM中的那些需要输出结果的函数。在包的方法解析顺序(Method resolution order)中,GLMResultsWrapper排在第一位,也就是说包会首先解析GLMR
2022-05-18 16:13:30
483
原创 python中的存储文件:excel+fig
文章目录1. 存储为excel2. 存储图片1. 存储为excel先创建一个编辑器:pd.ExcelWriter(path):writing DataFrame objects into excel sheets.将数据框对象写入到Excel表中。结合to_excel带入数据writer=pd.ExcelWriter('Logistic Performance Table{}.xlsx'.format(time.ctime()).replace(':','-'))model_summary()
2022-05-18 14:05:37
684
原创 pandas中的cut和qcut
文章目录1. cut2. qcut总体印象:cut和qcut都是用来对数据进行简单的分箱处理,其不同之处在于(1) qcut是一个等频分箱,按照分位数进行分箱,每个箱体里面的样本量相同,输入的是待切分数据和箱体的个数;而cut是一个等距分箱或者非等距分箱,其输入参数为bins,描述切分箱体的边界。1. cut用处分箱函数,可以指定分箱的边界,因此每个箱体里面的样本量不一定相等输入参数(1) 待切分的数据(2) 划分的分箱边界bins= 输出out返回类型(Categorical
2022-05-17 17:19:27
6270
1
原创 今日特辑:python中的__repr__方法
感谢python __repr__方法文章目录1.实例化对象2. 直接输出实例化对象3. 每个类都有__repr__方法最近遇到很多生成实例对象之后,直接打印出对象出现这种用尖括号包起来的返回值,对这种概念比较模糊,没有体系,因此今天询问阳哥之后,有了点点思路1.实例化对象左边写变量名,右边写函数,则左边的则是一个实例化的对象。执行变量名=函数之后就在内存中分配了一个此类的内存空间,有了内存空间就可以向里面存放定义的数据和进行方法的调用了,这就是对象的实例化。2. 直接输出实例化对象当我们输出
2022-05-17 14:13:16
663
原创 今天的特稿献给评分模型中的lift和KS
文章目录1. lift含义一2. 评分模型分区间求Lift1. lift含义一按照网上的含义,Lift衡量的是,与不利用模型相比,模型的预测能力“变好”了多少混淆矩阵中,positive表示“逾期”,negative表示“未逾期”预测positive预测negative实际positiveTPFN实际negativeFPTN使用模型后,得到的逾期率or坏样本率即TPTP+FP\frac{TP}{TP+FP}TP+FPTP,如果不使用模型,总体的坏账率表示为
2022-05-13 11:38:42
4418
原创 python中的StratifiedKFold
文章目录1. KFold2. StratifiedKFold3. generator4. 建模中的应用1. KFold首先要搞清楚,KFold是用于生成交叉验证的数据集的,而StratifiedKFold则是在KFold的基础上,加入了分层抽样的思想,使得测试集和训练集有相同的数据分布,因此表现在算法上,StratifiedKFold需要同时输入数据和标签,便于统一训练集和测试集的分布概念将数据K等分,依次选择其中一份作为测试集,其余k-1份作为训练集X=np.array([ [
2022-05-12 17:43:00
11172
4
原创 风控建模基础笔记(一)
文章目录KS曲线和KS值PSI指标IV指标数据分箱WOBIVKS曲线和KS值参考机器学习-KS值概念:从统计角度,我们知道KS是分析两组数据分布是否相同的检验指标。在金融领域中,我们的y值和预测得到的违约概率刚好是两个分布未知的两个分布。好的信用风控模型一般从准确性、稳定性和可解释性来评估模型。一般来说。好人样本的分布同坏人样本的分布应该是有很大不同的,KS正好是有效性指标中的区分能力指标:KS用于模型风险区分能力进行评估,KS指标衡量的是好坏样本累计分布之间的差值。好坏样本累计差异越大,KS指
2022-05-05 09:22:12
1445
原创 Mysql学习笔记(二)学完真可以出师系列第二弹
文章目录第五章5.1 视图5.2 子查询5.3 关联子查询第五章5.1 视图概念:从SQL的角度来看,视图和表是相同的,两者的区别在于表中保存的是实际的数据,而视图中保存的是SELECT语句(视图本身并不存储数据)。优点第一,由于视图并不存储数据,因此可以节省存储空间第二,可以进行调用select语句,避免重复书写。可以将频繁使用的 SELECT 语句保存成视图,这样就不用每次都重新书写了。创建好视图之后,只需在 SELECT 语句中进行调用,就可以方便地得到想要的结果了。特别是在进行汇总
2022-04-22 11:11:27
663
原创 Mysql学习笔记(一)学完就出师系列哈哈哈
本篇笔记是参照书籍《SQL基础教程》撰写的,MICK著,孙淼、罗勇译文章目录第一章 数据库和SQL1.1 DBMS概念数据库管理系统的种类:数据库结构1.2 SQL表的结构SQL摘要表的创建表的删除和更新表中插入数据变更表名第二章 查询基础2.1 select语句基础2.2 算术运算符2.3 逻辑运算符基本注意事项:;是SQL的结束符,换行不会影响语句结果,但是代码中间有空行(无任何字符的行)会造成执行错误。数据库的名称只能使用小写字母关键字不区分大小写,一般采用大写字符串和日期常数需要使用单
2022-04-19 17:55:32
787
原创 python爬虫笔记
爬虫爬虫:通过编写程序来获取互联网上的资源web请求过程剖析服务器渲染:在服务器那边直接把数据和html整合在一起,统一返回给浏览器客户端渲染:第一次浏览器发出请求,服务器端只返回html骨架;第二次发送数据请求,服务器端则返回相关数据;最后数据和html骨架在浏览器端进行整合,因此叫做客户端渲染。注意:在页面源代码中,无法看到数据。因此必须熟练使用浏览器抓包工具。HTTP协议协议:两个计算机之间为了能够流畅的进行沟通而设置的一个君子协定。常见的有TCP/IP. SOAP协议,HTT
2022-04-13 22:30:09
823
原创 pycharm基础概念和操作
1. 多行注释和vs code操作方式一样,即选中多行,快捷键:ctrl /2. f-string用大括号{}填入需要替换的变量if __name__=="__main__": #通过input去获取输入 query=input("请输入你想要搜索的内容:") url=f'https://www.sogou.com/web?query={query}'括号里可以填入表达式或者函数调用for i in range(1,5): print(f'我考了{i
2022-04-13 22:29:36
275
原创 前端基础——CSS3基础
1. 渐变背景提出:比较规则的渐变背景可以采用切片的方式,切1px渐变背景图片然后进行平铺,而不规则的渐变只能引入整张图片,可拓展新比较低,还会影响网页的加载速度。因此CSS3提出渐变背景background-image的属性,包括线性渐变和径向渐变线性渐变概念:渐变的颜色过度是沿着一条直线进行渐变语法:background-image: linear-gradient(to 方向,颜色1 位置1,颜色2 未知2 ,...)<style> .box1{
2022-04-11 15:26:25
528
原创 前端基础——html5新增标签
新增表单标签原始表单标签:input(text、password、radio、checkbox、button)、select、textarea、button、form。 h5增加了很多功能性的表单标签用于pc端和移动端的表单开发。邮箱:input(type="email"),提交数据时提供了邮箱格式的验证(格式不一定完全正确,因此以后需要通过js来进行调整;数字输入框:input(type="number"),网址输入框:input(type="url"),验证输入内容是否为网址,需要完整网址,以
2022-04-09 20:05:54
6511
原创 前端基础——BFC
FC概念FC(Formating context)格式化上下文,是css2.1提出的一个视觉渲染的概念。它是页面中一块渲染的区域,并且有一套自己的渲染规则,它决定了其子元素如何排列,以及和其他元素之间的相互关系BFCBFC--block formating context:块级格式化上下文,BFC是页面中的一个块级渲染区域。概念:指的是页面中的一个标签,不一定是块级标签。要成为BFC,有指定的满足条件。BFC有自己的排列规范,决定了BFC区域的子元素如何排列,以及与其他元素之间的相互关系
2022-04-09 11:22:20
684
原创 前端基础——定位
1.如何让盒子移动到指定的位置?(1) 采用margin的负值,破坏文档流进行移动。应用场景为头部内容和banner部分重叠(2) 采用定位技术.banner{ width: 100%; height: 500px; margin: 0px; background-color: pink; } .first{ width: 800px;
2022-04-08 19:50:46
4633
原创 前端基础——浮动
浮动1.块级元素同行显示块级元素本身是可设置宽高,独自成行,若想将块级元素同行显示,有以下两个方法:第一,采用行级元素和块级元素相互转换的方式dispaly:inline-block这种方法虽然能够使得块级元素同行显示,但是每个元素之间存在5px的间距,且对于某些浏览器来说存在兼容性的问题。第二,则是采用浮动的方法float:left|right|none2.浮动的特点相对于display来说:元素之间没有间距;不存在浏览器不兼容的问题;多个元素同行排列时,排列不下会自动换行;
2022-04-07 17:42:04
1661
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人