问题1:信贷数仓为什么要做分层设计?贴源层出现信贷合同状态反复变化怎么处理?
答: 分层本质是处理责任下放。ODS层存原始合同状态流水,DWD做SCD2拉链
处理保留历史变化轨迹。
业务场景:当风控部门回溯客户签约时点合同状态,DWD层通过effective_date/expire_date
精确关联历史版本,避免直接查ODS出现状态跳变。
上下游影响:ADS层指标计算必须明确"业务时间"还是"处理时间",下游宽表关联错误会导致监管报表数据失真。
问题2:信贷逾期指标计算要重点考虑哪些数仓设计?
答: 核心在于逾期标记与还款流水对齐。
-
在DWD层用
window函数
按合同编号+应还日期排序,计算连续逾期期数 -
痛点案例:部分还款场景需要按
冲抵规则
(先息后本)重算剩余本金 -
业务影响:风控宽表依赖逾期标记触发预警规则,还款流水时间戳错误会导致M2+逾期客户漏识别
问题3:如何处理信贷审批中的多头借贷识别?
答: 关键在于跨机构数据合流与时间窗