
数据分析
文章平均质量分 66
中了毒蛇粉的猫
数据分析学习笔记
展开
-
高频问题数据验证
高频数据问题,判断表是增量表还是全量表,判断两个字段关系,是不是一对一,一对多关系。原创 2022-10-23 20:09:03 · 342 阅读 · 0 评论 -
impala行转列问题
impala行转列问题原创 2022-10-18 08:51:46 · 1813 阅读 · 1 评论 -
数据测试常见错误
数据测试常见错误原创 2022-08-01 21:33:07 · 623 阅读 · 0 评论 -
row_number()函数随机排序
ID与XID是联合主键,row_number()里面只按ID分组,存在同一ID同一DT有多条数据,按DT降序排序会失效,此时函数会对这多条数据随机排出123名,每执行一次脚本,结果会有差异。如果外层查询是通过限制`WHERE RN=1`来取值,那取值结果就会存在随机性。...原创 2022-07-18 08:51:49 · 1647 阅读 · 0 评论 -
JOIN关联字段出现NULL值与空值
JOIN关联字段出现NULL值与空值的情况,如何处理原创 2022-06-08 17:54:32 · 4603 阅读 · 1 评论 -
SQL多表多字段比对方法
文章目录表-表比较整体思路找出不同字段的明细T1/T2两表ID相同的部分,是否存在不同NAME两表的交集与差集:判断两表某些字段是否相同两表的交集与差集:找出T2表独有的id字段-字段比较判断两个字段间一对多或多对一的关系证明id字段不是主键证明id, name字段不是联合主键数据准备表-表比较整体思路两张表条数一样条数相同是前提,然后比较字段值才有意义两表字段值完全相同【两表所有字段的值相同】两表所有字段union后,条数与另一张表条数一样两表字段值部分相同【两表部分字段的值相原创 2022-05-16 21:20:04 · 2359 阅读 · 0 评论 -
SQL中的重复值与null值处理
文章目录数据准备null空值处理空值 ''空值 nullcount与distinctunion与distinctsum与null重复值处理group by、distinct与row_number互换数据准备-- 建表CREATE TABLE IF NOT EXISTS TEST01.A( ID VARCHAR(50) COMMENT 'ID号' -- 01 ,NUMS原创 2022-05-16 21:18:32 · 884 阅读 · 0 评论 -
常用数据测试案例方法总结
目录一致性测试数据量比对金额字段SUM比对主键唯一空值校验枚举值脚本框架建表语句跑后查数一致性测试在做集市迁移时,甲方比较看重数据的一致性测试,一般会要求做新表与旧表的数据量比对,以及部分金额字段的字段级比对。下面给出的参考SQL都可以先在Excel中做好拼接语句,再整合到Python脚本框架中。一般整合之前可以先调试好SQL语句,也就是直接在SQL查询平台sqldbx,先跑一遍SQL,调试完毕再整合为Python脚本。数据量比对/* 表1与表2数据量比对 */insert into 库名.结果原创 2021-11-07 13:32:46 · 2764 阅读 · 1 评论 -
数据测试全流程总结(小白易上手)
文章目录数据测试一致性脚本写作风格一致性测试步骤补充知识创建临时表常用表达式SQL黑盒测试模板主键唯一null校验null decimal 为0null varchar为空极值 decimal极值 varchar枚举值数据测试做数据测试时,有黑盒测试和白盒测试,其中黑盒测试就是通过查询语句,检查目标表的表结构是否与设计文档一致,主键是否唯一非空,有无异常值,极值是否超出正常范围,枚举值检查数据是否合理分布,对应字段和字段内容是否一致。白盒测试就是检查开发老师的源码,字段信息(字段长度,最大最小值,异常值原创 2021-06-01 14:49:22 · 11341 阅读 · 1 评论 -
DBeaver、Navicat、MySQL高频报错及解决方法,此文持续更新
文章目录第一坑,没有用管理员身份第二坑,MySQL 服务无法启动第三坑,报错:ERROR 1045 (28000): Access denied for user 'root'@'localhost'第四坑,MySQL8.0后修改密码跟以前不一样电脑配置:系统64位win10,MySQL8.0.16第一坑,没有用管理员身份第一次登录,打开cmd,执行net start mysql报错:发生系统错误5错误原因:没有用管理员身份运行cmd第二坑,MySQL 服务无法启动用管理员身份运行cmd,执行原创 2021-04-11 11:07:52 · 1467 阅读 · 0 评论 -
造数常用的Excel表达式
文章目录Excel造数用到的高频表达式随机生成0与1,显示为“是”与“否”计算日期距离今天有几天生成随机时间输入1显示正常,输入0显示未激活VLOOKUP默认是模糊匹配根据百分比设置等级IF使用场景:将150%,或大于100%的百分数,显示成100%IF使用场景:正数换为0,负数取绝对值求余数,将大数变小多列合并为一列填充空白行多列需要将其上下叠加成一列多行文本合并成一行内容,复制次数,按列排序随机生成数字保留两位小数的随机数大批量填充合并两个单元格字符串Excel造数用到的高频表达式随机生成0与1,显原创 2021-03-23 06:54:54 · 1044 阅读 · 1 评论