DW 2.0:成本效益与数据质量的革新
1. 传统环境下数据分析的挑战与成本
在传统的数据环境中,企业进行新的数据分析面临诸多挑战。以公司 A 为例,其进行数据分析需经历以下步骤:
1. 查找数据 :要查找数据,必须对旧的遗留数据进行文档记录。然而,许多旧的遗留系统根本没有文档,即便有文档,也往往未及时更新。而且,这些系统缺乏命名标准,计算方式各异,编码标准繁多,导致查找和理解数据绝非易事。
2. 收集数据 :假设能找到并解读旧的遗留代码,接下来就是从遗留环境中收集数据。这需要早已失传的技能,找到具备这些技能的人员后,才能从遗留环境中提取数据。
3. 整合数据 :如果数据仅来自一个系统,整合不成问题;但如果来自多个系统,就会出现诸多问题,如关键结构不同、日期格式不同、部分数据缺失需应用默认值、属性名称不同、数据定义不同等。由于文档不足且系统采用古老的技术编写,要做好数据整合工作困难重重。
4. 数据分段 :数据查找、收集和整合完成后,需要将多个数据源的数据收集到一个物理位置。
5. 创建报告 :只有完成以上所有步骤,才能开始编写报告。
创建新分析的成本完全取决于遗留环境和所需的分析类型。一些遗留环境混乱不堪,而另一些则相对规整;有些报告和分析简单,而有些则非常复杂。构建一个新分析的成本可能在 10 万美元到 1000 万美元之间,耗时 3 个月到 3 年不等。成本差异巨大的因素包括:
- 遗留程序的数量
- 遗留系统的复杂性
- 遗留
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



