数据治理检查填写注意事项

表概况填写说明
默认过滤条件写上要加在所有sql语句的过滤条件,例如:delete_flag = 0 or del_flag = '' or del_flag is null
表概况检查项填写数据量、空值率等
检查项填写说明
总体说明1代表要检查,0代表不需要检查
重复性检查重复性检查适用于检查该表的主要字段数据是否重复。针对全表,按多个字段去重,看是否每行记录是唯一的,填写0或1,0代表该字段忽略,不进行去重;
唯一性检查唯一性检查适用于确定表的物理主键或业务主键,针对字段,单独检查该字段的值是否为唯一值,1代表要检查,0代表不需要检查
数据阈值检查数据阈值检查适用于检查时间范围和数据范围,0代表不检查,如检查数值范围,用中括号和冒号表示:[1:100] ,如没有限定范围,只要查出最大值最小值表,则用函数名表示:max(), min() ;
枚举值数据检查枚举值数据检查适用于确定枚举值类型字段的值,是否偏离预期。1代表查询出各种枚举值,0代表不需要查询
数据精度一致性数据精度一致性主要是针对经纬度数据做检查,用于确定精度是否一致,精度是否符合要求,一般认为,经纬度数据要精确到小数点后6位。1代表检查,0代表不需要检查
字符长度一致性字符长度一致性检查主要是针对字符串类型数据做检查,适用于字符长度应当一致的数据。1代表检查,0代表不需要检查。
数据自洽性检查数据自洽性适用于2个字段存在关联的数据,假如A字段是由B字段处理得到的,例如:年龄字段是由身份证字段得到,则应验证2者之间的关系是否正确。用表达式表示:floor(abs(cast(months_between(current_date(), from_unixtime(unix_timestamp(substr(id_card, 7, 8),'yyyymmdd'),'yyyy-mm-dd'))as int))/12) = age
有效性检查有效性检查会调用函数对字段进行查询,前提是必须先在hive库创建好对应的函数,例如:身份证有效性检查,则填写:id_check(),统一信用代码有效性检查,则填写:credit_code_check()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一凡888

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值