抽取、转换和装载介绍(二)归拢需求

本文探讨了ETL系统设计中的关键需求,包括业务需求、合规性、数据质量、安全性等十个方面,确保数据处理的有效性和准确性。

没怎么搞过实际项目,但是也觉得需求分析确实是很重要的。在进行数据的ETL时,归拢需求很关键,涉及到收集并整理所有已知的需求、实际情况和影响ETL系统的约束。

关于ETL系统设计和开发有一下几个方面的需求。

1、业务需求

这里业务需求很直接,就是DW/BI系统用户的信息需求,后面的过程需要那些数据,我的ETL就应该以其为目标。

2、合规性

合规性是说提供的表报中的数据必须是正确和完整的,并没有经过任何篡改。

一般数据仓库中应该特别注意的需求有:

  • 保存数据源和随后数据登台的副本;
  • 为改变任何数据结果的完整性的事物处理流程提供证明;
  • 完整记录用于分配、调整和推导的算法;
  • 随时间推移为数据副本的保密性提供证明,包括在线和离线。

3、数据质量

数据质量的重要性怎么强调都不过分。

  • 好的数据质量对于数据挖掘的效果来说其关键性作用,好数据,好业务;
  • 数据源大多都是分布式的,需要对各种不同的数据进行有效集成;
  • 合规性的需求使得不能对数据进行粗心大意的处理。

4、安全性

数据仓库行业对于数据安全性的心态是矛盾的,数据仓库本身追求如何向决策制定者广泛的发布数据,

而安全性则要求对数据进行限制,只有需要了解的用户才有权访问。

5、数据集成

数据集成最终目标是要是所有的系统无缝联接、协调工作。数据集成表现在数据仓库中的一致性维度和一致性事实。

一致性维度是指确立整个业务过程中公共的维度属性。

一致性事实是说对各个独立数据库的公共业务指标达成一致。

6、数据等待时间

数据等待时间描述了源系统数据通过DW/BI系统提供给业务用户的速度有多快。

数据等待时间对ETL的架构有重大影响。

巧妙的处理算法、并行化处理和强有力的硬件支持可以加速传统的面向批处理的数据流。

如果要求等待时间很急迫,ETL系统架构即必须从批处理转向流处理。

7、存档和沿袭

建议是在ETL管道的每个主要活动(抽取、清洗和一致化,以及提交)之后都将数据写入磁盘。

8、用户提交界面

ETL的最后一步是将数据移交给BI应用程序,必须对数据内容和结构负责。

否则导致BI应用程序复杂度大大增加,降低查询和创建报表的速度,并使用户感觉数据过于复杂。

9、可用的技能

有些ETL决策必须基于建立和管理系统时所能获得的人力资源来制定。

比如团队自身没有C++编程能力或者无法达到相应的水平,就不应该建立一个严重依赖于C++语言的处理模块。

如果有了主流厂商的ETL工具相关技能,心里就有谱多了。

另一个是手工编写代码生成ETL工具,还是使用厂商的开发包。

10、遗留许可证

这个还没看懂啥意思,许可证?软件的许可证?

转载于:https://www.cnblogs.com/tuhooo/p/5377134.html

本虚拟仿真平台把MATLAB R2021a当作开发环境,充分借助其在数值计算、图形绘制以及GUI设计上的强大本领,构建出一个集成化的实验教学系统体系,意在为学生搭建一个高效、方便且功能齐全的实验学习平台。 系统按照模块化设计理念,恰当划分为多个功能模块,涵盖主界面模块、实验指导模块、实验项目模块、参数配置模块、仿真计算模块以及结果分析等相关模块,实现了功能的明确划分与高效归拢,主界面模块充当整个系统的入口,呈现简洁直观的操作界面,让用户可以轻松地进入其他模块,开展实验操作同时设置各项参数,实验项目模块具备四个典型的实验项目,涉及自动控制原理课程的核心要点,为学生提供了多样的实验选项。 参数设置模块赋予用户自由调整实验参数的权限,实现特色化实验安排,符合不同用户对实验条件的多样需求。仿真计算模块为平台的核心构成,采用MATLAB的数值计算能力对实验过程开展精确模拟,可快速且无误地处理复杂的数学模型算法,实现对实验操作的实时模拟。 结果分析模块的职责是对仿真计算得出的数据实施可视化处理,利用画图、生成报告等手段,直观地展现实验结果,帮助学生更深刻地理解与剖析实验数据。 各模块借助明确的接口开展交互与数据传输,组成了一个有机结合的整体。接口的标准化设计实现了各模块间的无缝衔接,不仅让系统的整体性跟协调性得以维持,还便于后续对系统进行扩展及维护,若需要新增实验功能或对现有的功能进行优化,只需针对相应模块进行修改及更新,而无需对整个系统做大规模的改动。 模块化设计也提升了系统维护的高效性,让故障排查及修复过程更简单,这种设计思路不仅结合了系统工程的先进理念,也为教育平台长久的可持续发展提供支持,保证了整个虚拟仿真平台高效运行且长期维持有效。 帮我用一句话这段话并生成总体框架图
05-28
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值