电子政务行业的数据中心测试

本文详细阐述了电子政务行业中数据中心测试的重点环节,包括抽取方案稳定性、数据传送合理性、抽取策略合理性、数据抽取与加载业务逻辑关系、历史记录处理、加载策略、数据延迟范围、数据断层测试以及数据采集工具本身功能和采集任务定时调度。此外,文章还讨论了数据质量分层测试的重要性,覆盖了从源数据层到应用数据层的数据处理全过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

电子政务行业的数据中心测试

电子政务行业的数据中心搭建结构图:

 

 

根据数据中心的系统特点,测试重点可以从下面几个方面着手:

1、抽取方案稳定性测试:抽取方案的稳定性,如果源系统数据库表结构有改变,能否保证ETL抽取方案不变或者微变。

 

2、数据传送方案合理性测试:源系统以何种形式把数据提供给前置机?数据的形式库或者文件的形式传送?前置机数据以何种形式提供给数据中心核心库?是源系统主动推送还是采集工具主动抽取?

 

3、抽取策略的合理性测试:全量抽取或者增量抽取。源系统的数据采用全量抽取,或者是增量抽取?

  对于增量抽取,如何捕捉变化的数据?如新增、修改、删除等变化数据的处理?

增量抽取时间戳字段的选择?

 

4、数据抽取与加载业务逻辑关系测试:数据表之间是否存在关联、依赖关系,如a表数据还未采集完成或者没有采集,是可以开始b表数据的采集,加载也一样,是否依照了业务关系文档?

 

5、历史记录的处理方案测试:数据库表是否需要保存历史记录?保留历史记录的方式?拉链记历史?

 

6、加载策略的测试:1、trunctae and insert.直接清空目标表,然后把新的数据加载进去。2、append.先根据规则清除当天的记录,然后把当天的新数据追加进去。3、update and insert.用新数据与目标表中的历史数据进行比较,有变化的则更新,新记录则直接插入到目标表中。

 

7、数据延迟的范围的测试:包括前置机与源数据库的数据延迟,前置机与数据中心的数据延迟,测试是否达到需求标准

 

8、数据断层的测试:数据中心的数据根据业务进行关联,是否存在数据孤岛,即关联不上的数据?

 

9、数据采集工具本身的功能是否需要涉及?如数据工具自带的多配置功能

 

10、采集任务定时调度测试:采集任务是否支持可配置?定时调度?

 

11、数据质量的分层测试:包括odl(源数据层)、bdl(基础数据层)、idl(接口数据层)、adl(应用数据层)


评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值