SQL SERVER 2012 DQS 是新的功能,下面通过实例练习来实现数据净化.
1,启动DATA QUALITY CLIENT,建立一个新 KNOWLEDGE BASE,根据DQS 文件.
2,选择DOMANIN MANAGEMENT,点NEXT

所有DOMAIN已经列出,注意DOMAIN RULE,这里以EMAIL ADDRESS为例,结尾为@ADVENTURE-WORKS.COM,并且要符合REGULAR EXPRESSION.

再看上面的TITLE ENRICHMENT,它是组合DOMAIN,包括 GENDER,MARITAL STATUS,TITLE三个DOMAIN,看它的RULE,很清楚。
女性,已婚,是MRS,呵呵,不应该是 MR OR MS.
3,建立一个新DATA PROJECT,选CLEANSING,NEXT,选数据源,支持SQL和EXCEL等,然后与DOMAIN进行MAPPING,点“开始"
,,,,,,,,,,,,,,,,,,,,,,,,,,,,DQS SERVER 开始工作...........................CLEANSING
结束后,进入互动CLEANSING阶段,可以批准,拒绝,编辑,修订等等,,,,

4,最后是出口数据,根据需求,有不同选择。
本文介绍如何使用SQL Server 2012的数据质量服务(DQS)进行数据清洗。通过实例演示了创建知识库、定义域管理规则、设置数据项目及清洗流程,并最终导出清理后的数据。
1720

被折叠的 条评论
为什么被折叠?



