30、数据质量:确保数据库可靠性的关键

数据质量:确保数据库可靠性的关键

在计算机领域,早在上世纪60年代就有这样一个广为认同的说法:“垃圾进,垃圾出”(GIGO)。在数据库兴起的那些年,这个概念曾一度被淡忘。但如今,随着一些数据仓库的数据量逼近PB级,数据质量再次变得极为重要。

数据质量的重要性

数据质量指的是数据库中的数据要准确、及时,并且在需要时能够获取。数据质量确保了数据的准确性和及时性,而且在数据进入数据库之前确保其质量,要比数据存储之后再去处理容易得多。

我们如此关注数据质量,是因为我们需要确信从数据库中检索到的数据是可靠的。我们的运营和战略决策都基于从数据库中获取的数据,这些决策的质量直接取决于数据的质量。

以SmartMart这样的零售连锁店的服装采购决策为例。采购人员会根据前一年的销售情况和对服装款式的了解,提前9到12个月为冬季假日购物季选择库存商品。他们会查询运营数据库,生成每个款式在各个门店和网络上的销售报告,然后根据销售模式调整订单。但如果销售数据有误,就可能导致为每个门店订购错误的商品。在假日购物季,顾客往往不愿等待商品到货,他们可能会购买其他商品或转向其他零售商,最终导致SmartMart的销售损失。

不准确的数据会给企业带来诸多问题,如因电话号码或电子邮件地址过时无法联系到客户、订单缺失未发货的商品、客户未收到召回通知等。总之,数据出现问题,企业就会受损。而且,数据库应用程序崩溃有时比生成包含不准确结果的报告要好,因为前者能明确知道存在问题,而后者可能没有迹象表明报告无效,从而会继续使用这些错误数据。

识别和处理不完整数据

数据质量问题的一个来源是数据缺失,主要有两种情况:从未录入数据库的数据和不应删除却

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值