数据质量研究与实践:概念、框架与应用
1. 数据质量的重要性与领域发展
在当今的商业环境中,许多重要的企业计划,如企业对企业的商务活动、集成供应链管理和企业资源规划等,都面临着失败的风险,除非数据质量得到认真的考虑和改善。例如,一项对一家大型制造商的研究发现,70%的订单存在错误。类似的高风险数据质量问题在学术文献和新闻报道中屡见不鲜,像一家大型金融机构因错误输入5亿美元的执行订单而尴尬,一些东北州因不良信用数据对TRW提起数百万美元的诉讼,抵押贷款公司错误计算房主的可调整利率每月抵押贷款还款额,总计达数十亿美元,以及许多患者因处方数据错误而死亡或重病等。
过去十年,数据质量领域取得了显著进展。研究人员和从业者已经从确立数据质量作为一个领域,转向解决数据质量问题,涵盖了数据质量的定义、测量、分析和改进,以及相关的工具、方法和流程。如今,有大量的数据质量资源可供利用,许多专业书籍、期刊文章和会议论文集也不断涌现。非营利性学术会议和商业会议也成为数据质量领域的一部分。1996年,麻省理工学院的全面数据质量管理(TDQM)计划开创了首个学术会议,用于研究人员和从业者交流研究想法和成果,此后每年都会举办麻省理工学院信息质量会议。此外,许多信息系统和计算机科学会议现在也设有数据质量相关的专题或教程。商业会议通常会邀请演讲嘉宾,并举办供应商和顾问研讨会。因此,对该领域的研究和实践进行阐述既及时又有价值。
2. 基本概念
2.1 数据与信息
在文献中,数据和信息常被互换使用。但在实践中,管理者会直觉地区分信息和数据,将信息描述为经过处理的数据。除非另有说明,这里将数据和信息这两个术语互换使用。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



