自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

原创 分组函数应用(sql+python)总结

经常会遇见对某个字段进行分组、统计等,其中还包括一些比较细致的问题,有时往往会忘记,这里做个记录。

2024-02-01 10:48:39 752

原创 时间处理函数

因为时间处理问题,导致数据与业务方一直不吻合,找了很久的原因,才发现原来是时间处理上出了问题,因此总结下经验,希望更加细致。

2024-02-01 09:43:07 465

原创 sql里面按照某一列求历史累计最大值rows BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW

累计历史最大逾期天数指标计算

2024-01-15 10:39:37 688 1

原创 知识补给站20230419-20230421

周记

2023-04-23 14:04:52 1011

原创 dataframe比较常用到的操作

dataframe操作必知必会

2023-02-17 17:28:59 355

原创 关于操作python环境和包的cmd说明

cmd操作python的小总结

2023-02-17 14:00:24 2052

原创 写入excel文件的ExcelWriter、openpyxl、xlsxwriter

写入excel文件相关知识

2023-02-17 11:43:18 9095

原创 整个建模流程

逻辑回归建模流程代码

2023-02-16 17:46:18 328

原创 变量衍生(一)

变量衍生初步想法

2023-02-15 16:11:09 321

原创 几何方法清晰数组中的轴

今天看到某公众号上的numpy高级操作中的轴的交换,花了些许时间以及结合双人之力总算是差不多弄清楚了,分享给在座的各位。

2022-12-01 11:42:29 892

原创 统计学基础面点

面试统计学基础

2022-08-23 17:46:17 589

原创 python中书写函数map, lambda, def,列表推导式

简单和复杂定义函数

2022-08-04 13:46:36 444

原创 风控名词解释

风控基础名词-边看边写

2022-07-28 09:30:11 1488

原创 SQL截取字符串合辑

SQL中截取字符串

2022-07-28 09:25:20 4021

原创 评分卡模型分数转换整个流程

评分卡模型后续的分数转换公式推导和代码

2022-06-20 18:19:33 3036

原创 非官方的juoyter notebook 扩展包

非官方的jupyter notebook 扩展包

2022-06-20 16:50:28 583

原创 python数据预处理总结

数据预处理的一些笔记

2022-06-09 17:16:40 2493

原创 python中的json解析

python中解析json语句

2022-06-08 17:00:58 403

原创 python中的魔法函数

可以简化日常工作的python中的魔法函数魔法函数,适用于所有IPython中的操作1. %lsmagic该魔法函数的作用为在,并且可以这条语句不得不说这是一个很强大的魔法函数,应用型比较强。他的作用是在a.py里面生成的数(或者说从sql里面读取的数据量比较大的数据时)先保存,然后,此时不必再去重新读取数据进行其他操作。需要注意的是读取的时候需要使用该魔法函数是用于,当你的代码块比较多且显示的数据也比较多时,可以用该魔法函数清除已经显示的代码块...

2022-06-07 15:19:53 1839

原创 python中的GLMResultsWrapper

文章目录1. 需求2.用法1. 需求在做项目时,源代码可能无法满足我们的业务需求,因此我们需要改变已有包中的某些函数,然后用自己的函数去覆盖它,从而得到符合项目需求的结果.在逻辑回归的风险模型中,主要用到的是GLMResultsWrapper进行覆盖。其中wrapper:包装器,从名字上可以理解为GLM结果的包装器,也就是GLM中的那些需要输出结果的函数。在包的方法解析顺序(Method resolution order)中,GLMResultsWrapper排在第一位,也就是说包会首先解析GLMR

2022-05-18 16:13:30 483

原创 python中的存储文件:excel+fig

文章目录1. 存储为excel2. 存储图片1. 存储为excel先创建一个编辑器:pd.ExcelWriter(path):writing DataFrame objects into excel sheets.将数据框对象写入到Excel表中。结合to_excel带入数据writer=pd.ExcelWriter('Logistic Performance Table{}.xlsx'.format(time.ctime()).replace(':','-'))model_summary()

2022-05-18 14:05:37 684

原创 pandas中的cut和qcut

文章目录1. cut2. qcut总体印象:cut和qcut都是用来对数据进行简单的分箱处理,其不同之处在于(1) qcut是一个等频分箱,按照分位数进行分箱,每个箱体里面的样本量相同,输入的是待切分数据和箱体的个数;而cut是一个等距分箱或者非等距分箱,其输入参数为bins,描述切分箱体的边界。1. cut用处分箱函数,可以指定分箱的边界,因此每个箱体里面的样本量不一定相等输入参数(1) 待切分的数据(2) 划分的分箱边界bins= 输出out返回类型(Categorical

2022-05-17 17:19:27 6270 1

原创 今日特辑:python中的__repr__方法

感谢python __repr__方法文章目录1.实例化对象2. 直接输出实例化对象3. 每个类都有__repr__方法最近遇到很多生成实例对象之后,直接打印出对象出现这种用尖括号包起来的返回值,对这种概念比较模糊,没有体系,因此今天询问阳哥之后,有了点点思路1.实例化对象左边写变量名,右边写函数,则左边的则是一个实例化的对象。执行变量名=函数之后就在内存中分配了一个此类的内存空间,有了内存空间就可以向里面存放定义的数据和进行方法的调用了,这就是对象的实例化。2. 直接输出实例化对象当我们输出

2022-05-17 14:13:16 663

原创 今天的特稿献给评分模型中的lift和KS

文章目录1. lift含义一2. 评分模型分区间求Lift1. lift含义一按照网上的含义,Lift衡量的是,与不利用模型相比,模型的预测能力“变好”了多少混淆矩阵中,positive表示“逾期”,negative表示“未逾期”预测positive预测negative实际positiveTPFN实际negativeFPTN使用模型后,得到的逾期率or坏样本率即TPTP+FP\frac{TP}{TP+FP}TP+FPTP​,如果不使用模型,总体的坏账率表示为

2022-05-13 11:38:42 4418

原创 python中的StratifiedKFold

文章目录1. KFold2. StratifiedKFold3. generator4. 建模中的应用1. KFold首先要搞清楚,KFold是用于生成交叉验证的数据集的,而StratifiedKFold则是在KFold的基础上,加入了分层抽样的思想,使得测试集和训练集有相同的数据分布,因此表现在算法上,StratifiedKFold需要同时输入数据和标签,便于统一训练集和测试集的分布概念将数据K等分,依次选择其中一份作为测试集,其余k-1份作为训练集X=np.array([ [

2022-05-12 17:43:00 11172 4

原创 风控建模基础笔记(一)

文章目录KS曲线和KS值PSI指标IV指标数据分箱WOBIVKS曲线和KS值参考机器学习-KS值概念:从统计角度,我们知道KS是分析两组数据分布是否相同的检验指标。在金融领域中,我们的y值和预测得到的违约概率刚好是两个分布未知的两个分布。好的信用风控模型一般从准确性、稳定性和可解释性来评估模型。一般来说。好人样本的分布同坏人样本的分布应该是有很大不同的,KS正好是有效性指标中的区分能力指标:KS用于模型风险区分能力进行评估,KS指标衡量的是好坏样本累计分布之间的差值。好坏样本累计差异越大,KS指

2022-05-05 09:22:12 1445

原创 Mysql学习笔记(二)学完真可以出师系列第二弹

文章目录第五章5.1 视图5.2 子查询5.3 关联子查询第五章5.1 视图概念:从SQL的角度来看,视图和表是相同的,两者的区别在于表中保存的是实际的数据,而视图中保存的是SELECT语句(视图本身并不存储数据)。优点第一,由于视图并不存储数据,因此可以节省存储空间第二,可以进行调用select语句,避免重复书写。可以将频繁使用的 SELECT 语句保存成视图,这样就不用每次都重新书写了。创建好视图之后,只需在 SELECT 语句中进行调用,就可以方便地得到想要的结果了。特别是在进行汇总

2022-04-22 11:11:27 663

原创 Mysql学习笔记(一)学完就出师系列哈哈哈

本篇笔记是参照书籍《SQL基础教程》撰写的,MICK著,孙淼、罗勇译文章目录第一章 数据库和SQL1.1 DBMS概念数据库管理系统的种类:数据库结构1.2 SQL表的结构SQL摘要表的创建表的删除和更新表中插入数据变更表名第二章 查询基础2.1 select语句基础2.2 算术运算符2.3 逻辑运算符基本注意事项:;是SQL的结束符,换行不会影响语句结果,但是代码中间有空行(无任何字符的行)会造成执行错误。数据库的名称只能使用小写字母关键字不区分大小写,一般采用大写字符串和日期常数需要使用单

2022-04-19 17:55:32 787

原创 python爬虫笔记

爬虫爬虫:通过编写程序来获取互联网上的资源web请求过程剖析服务器渲染:在服务器那边直接把数据和html整合在一起,统一返回给浏览器客户端渲染:第一次浏览器发出请求,服务器端只返回html骨架;第二次发送数据请求,服务器端则返回相关数据;最后数据和html骨架在浏览器端进行整合,因此叫做客户端渲染。注意:在页面源代码中,无法看到数据。因此必须熟练使用浏览器抓包工具。HTTP协议协议:两个计算机之间为了能够流畅的进行沟通而设置的一个君子协定。常见的有TCP/IP. SOAP协议,HTT

2022-04-13 22:30:09 823

原创 pycharm基础概念和操作

1. 多行注释和vs code操作方式一样,即选中多行,快捷键:ctrl /2. f-string用大括号{}填入需要替换的变量if __name__=="__main__": #通过input去获取输入 query=input("请输入你想要搜索的内容:") url=f'https://www.sogou.com/web?query={query}'括号里可以填入表达式或者函数调用for i in range(1,5): print(f'我考了{i

2022-04-13 22:29:36 275

原创 前端基础——CSS3基础

1. 渐变背景提出:比较规则的渐变背景可以采用切片的方式,切1px渐变背景图片然后进行平铺,而不规则的渐变只能引入整张图片,可拓展新比较低,还会影响网页的加载速度。因此CSS3提出渐变背景background-image的属性,包括线性渐变和径向渐变线性渐变概念:渐变的颜色过度是沿着一条直线进行渐变语法:background-image: linear-gradient(to 方向,颜色1 位置1,颜色2 未知2 ,...)<style> .box1{

2022-04-11 15:26:25 528

原创 前端基础——html5新增标签

新增表单标签原始表单标签:input(text、password、radio、checkbox、button)、select、textarea、button、form。 h5增加了很多功能性的表单标签用于pc端和移动端的表单开发。邮箱:input(type="email"),提交数据时提供了邮箱格式的验证(格式不一定完全正确,因此以后需要通过js来进行调整;数字输入框:input(type="number"),网址输入框:input(type="url"),验证输入内容是否为网址,需要完整网址,以

2022-04-09 20:05:54 6511

原创 前端基础——BFC

FC概念FC(Formating context)格式化上下文,是css2.1提出的一个视觉渲染的概念。它是页面中一块渲染的区域,并且有一套自己的渲染规则,它决定了其子元素如何排列,以及和其他元素之间的相互关系BFCBFC--block formating context:块级格式化上下文,BFC是页面中的一个块级渲染区域。概念:指的是页面中的一个标签,不一定是块级标签。要成为BFC,有指定的满足条件。BFC有自己的排列规范,决定了BFC区域的子元素如何排列,以及与其他元素之间的相互关系

2022-04-09 11:22:20 684

原创 前端基础——定位

1.如何让盒子移动到指定的位置?(1) 采用margin的负值,破坏文档流进行移动。应用场景为头部内容和banner部分重叠(2) 采用定位技术.banner{ width: 100%; height: 500px; margin: 0px; background-color: pink; } .first{ width: 800px;

2022-04-08 19:50:46 4633

原创 前端基础——浮动

浮动1.块级元素同行显示块级元素本身是可设置宽高,独自成行,若想将块级元素同行显示,有以下两个方法:第一,采用行级元素和块级元素相互转换的方式dispaly:inline-block这种方法虽然能够使得块级元素同行显示,但是每个元素之间存在5px的间距,且对于某些浏览器来说存在兼容性的问题。第二,则是采用浮动的方法float:left|right|none2.浮动的特点相对于display来说:元素之间没有间距;不存在浏览器不兼容的问题;多个元素同行排列时,排列不下会自动换行;

2022-04-07 17:42:04 1661

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除