信贷风控策略/模型监控_基于sql优化

**

1 sql编写规范性

**

编写原则:有序不杂乱、直观可读性强、不降低执行效率。

  1. 换行和缩进;(union、case when、占比等串行语句;整体三段式:查询段-表关联段-条件判断段)
  2. 排列有序可循;(关联表:数据来源/业务流程分块;字段排序同理)
  3. 勤写注释;(表名comment; 字段码值 ;注意事项说明;判断逻辑–复杂判断逻辑注释,便于理解,尤其特殊非通用性条件,如样本选择和时间段注释,方便溯源)
  4. 表命名避免使用a b c或 t1 t2 t3之类,避免混淆;
  5. 字段带表名,便于核对数据源;
  6. 逗号写在前,增加可读性,便于查错;
  7. 尽量避免使用in,尤其客户id。

【例1】信贷业务多表关联编写举例:

create table detail as 
select 
DATE_FORMAT(sqzhb.APPL_TIME,'%Y-%m')  as 申请月份
,dkjg.PRODUCT_CODE as 产品小类
,case when  pjmx.SCORE is null then '未评分'  
 when pjmx.SCORE<=20 then '  (0,20]'  when pjmx.SCORE<=40 then ' (20,40]'  when pjmx.SCORE<=60 then ' (40,60]' 
 when pjmx.SCORE<=80 then ' (60,80]'  when pjmx.SCORE<=90 then ' (80,90]' else '(90,100]' end as 评分区间 

-- 1、申请审批情况
from ( select * from (select a.* ,@num2 := IF(@str2 =  APPL_CERTIFICATE_NUMBER ,@num2 + 1, 1) as rn
 from LM_LOAN_APPLICATION_INFO a ,(SELECT @str2 := '', @num2 := 0) b
 order by APPL_CERTIFICATE_NUMBER ,APPL_TIME desc )t where rn=1
) as  sqzhb -- 【1-申请主表:LM_LOAN_APPLICATION_INFO】申请客户去重,ROW_NUMBER() OVER()在此mysql版本不支持
left join LM_LOAN_APPLICATION as sqzb on sqzhb.req_id = sqzb.original_appl_id -- 【2-申请子表:LM_LOAN_APPLICATION】
left join lm_application_result as dkjg on sqzb.req_id = dkjg.req_id -- 【3-贷款结果表:lm_application_result】
left join lm_application_audit_result as  dkjjsp on sqzb.business_id = dkjjsp.business_id and sqzb.PRODUCT_CODE=dkjjsp.PRODUCT_CODE -- 【4-最终进件表:lm_application_audit_result】

-- 2、签约情况
left join lm_loan_apply_report_list as cont on dkjg.business_id = cont.business_id and dkjg.PRODUCT_CODE = cont.PRODUCT_CODE -- 【5-合同信息表:lm_loan_apply_report_list】

-- 3、支用申请情况
left join (select  zyjg.business_id, zysq.APPROVAL_BUSINESS_ID ,dkjjsp.PRODUCT_CODE ,sum(zysq.DISBURSE_AMOUNT) as  DISBURSE_AMOUNT
  from (select * from  lm_disburse_result where DISBURSE_RESULT='Y') zyjg -- 【6-支用结果表:lm_disburse_result】
  left join (select * from  lm_disburse_application where STATUS='2') as zysq  on zysq.DISBURSE_ID = zyjg.DISBURSE_ID --【7-支用申请表:lm_disburse_application 】
  left join lm_application_audit_result as  dkjjsp on zysq.business_id = dkjjsp.business_id -- 最终进件表
  group by zyjg.business_id, zysq.APPROVAL_BUSINESS_ID, dkjjsp.PRODUCT_CODE
) as zyxx on dkjg.business_id = zyxx.business_id  and dkjg.PRODUCT_CODE = zyxx.PRODUCT_CODE  

-- 4、放款情况
left join( 
select
loan.cont_no	-- as 合同编号
,dkjjsp.business_id 
,dkjjsp.PRODUCT_CODE
,max(loan.ovdue_days) as 最长逾期天数
,sum(repayplan.should_pay_amt) as 应还金额
from  bdp_cm_inte_co_lon_info as loan -- 【8-借据信息表:bdp_cm_inte_co_lon_info】
left join ( select dubil_no ,sum(repay_amt) as	repay_amt
 from bdp_cm_inte_co_lon_repay_dtl    -- 【9-还款明细表:bdp_cm_inte_co_lon_repay_dtl】
 group by dubil_no
8.用执行计划分析SQL性能      EXPLAIN PLAN是一个很好的分析SQL语句的工具,它可以在不执行SQL的情况下分析语句      通过分析,我们就可以知道ORACLE是怎样连接表,使用什么方式扫描表(索引扫描或全表扫描),以及使用到的索引名称      按照从里到外,从上到下的次序解读分析的结果      EXPLAIN PLAN的分析结果是用缩进的格式排列的,最内部的操作将最先被解读,如果两个操作处于同一层中,带有最小操作号的将首先被执行      目前许多第三方的工具如PLSQL Developer和TOAD等都提供了极其方便的EXPLAIN PLAN工具      PG需要将自己添加的查询SQL文记入log,然后在EXPLAIN PLAN中进行分析,尽量减少全表扫描      ORACLE SQL性能优化系列      1.选择最有效率的表名顺序(只在基于规则的优化器中有效)      ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,因此FROM子句中写在最后的表(基础表driving table)将被最先处理      在FROM子句中包含多个表的情况下,必须选择记录条数最少的表作为基础表      当ORACLE处理多个表时,会运用排序及合并的方式连接它们      首先,扫描第一个表(FROM子句中最后的那个表)并对记录进行排序;      然后扫描第二个表(FROM子句中最后第二个表);      最后将所有从第二个表中检索出的记录与第一个表中合适记录进行合并      例如:      表 TAB1 16,384 条记录      表 TAB2 5 条记录      选择TAB2作为基础表 (最好的方法)      select count(*) from tab1,tab2 执行时间0.96秒      选择TAB2作为基础表 (不佳的方法)      select count(*) from tab2,tab1 执行时间26.09秒      如果有3个以上的表连接查询,那就需要选择交叉表(intersection table)作为基础表,交叉表是指那个被其他表所引用的表      例如:   EMP表描述了LOCATION表和CATEGORY表的交集   SELECT *   FROM LOCATION L,   CATEGORY C,   EMP E   WHERE E.EMP_NO BETWEEN 1000 AND 2000   AND E.CAT_NO = C.CAT_NO   AND E.LOCN = L.LOCN      将比下列SQL更有效率   SELECT *   FROM EMP E ,   LOCATION L ,   CATEGORY C   WHERE E.CAT_NO = C.CAT_NO   AND E.LOCN = L.LOCN   AND E.EMP_NO BETWEEN 1000 AND 2000      2.WHERE子句中的连接顺序      ORACLE采用自下而上的顺序解析WHERE子句      根据这个原理,表之间的连接必须写在其他WHERE条件之前,那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾      例如:   (低效,执行时间156.3秒)   SELECT *   FROM EMP E   WHERE SAL > 50000   AND JOB = 'MANAGER'   AND 25 < (SELECT COUNT(*) FROM EMP WHERE MGR=E.EMPNO);      (高效,执行时间10.6秒)   SELECT *   FROM EMP E   WHERE 25 50000   AND JOB = 'MANAGER';      3.SELECT子句中避免使用'*'      当你想在SELECT子句中列出所有的COLUMN时,使用动态SQL列引用'*'是一个方便的方法,不幸的是,这是一个非常低效的方法      实际上,ORACLE在解析的过程中,会将'*'依次转换成所有的列名      这个工作是通过查询数据字典完成的,这意味着将耗费更多的时间      4.减少访问数据库的次数
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值