left join NULL踩坑

1、背景

因为最近响应监管,做数据全面匿名化的需求。会在写入数据库时,把姓名身份证做MD5处理后,只保留32位的前30位,保证即使拿到处理后的数据,也无法复原,恢复到源数据。

相应的,大数据BDP HIVE这边的数据处理也要做相应的改造,之前处理时会判断身份证位数,如果非15位和18位,则认为数据不正确,置为NULL。姓名身份证匿名化后要去除这个判断逻辑。

直接去除后上线,产品反馈出的报表数据有问题,数据汇总的表,总数=无源+有源,其中有源数据不对。

形如这种:
在这里插入图片描述

2、问题分析

去查了下对应代码:

select
,'当日' as time_type
,sum(case when last_created_date='20240104' then day_pv else 0 end) valid_pv
,sum(case when src_last_created_date='20240104'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值