AI实践与实施:问题与成本
1. 数据质量维度
数据质量维度(DQDs)对于评估数据质量至关重要,以下是五个被广泛认可的数据质量维度:
1. 完整性(Completeness) :衡量数据对于其应用任务而言,在广度和深度上是否足够完整。
2. 可解释性(Interpretability) :考察数据标题和单位的定义是否清晰,以及描述数据时所使用的语言、单位和符号是否恰当。
3. 相关性(Relevance) :判断数据是否适用于当前任务,还是仅有间接的用途。
4. 及时性(Timeliness) :评估数据对于当前应用是否足够及时、最新。
5. 清洁度(Cleanliness) :检测数据是否可靠、正确且基本无错误。
在医疗应用中,这些数据质量维度尤为重要。以个性化决策支持系统(PDSS)为例,该系统旨在通过大数据分析,以循证的方式提升个性化医疗水平。显然,在实施或依赖PDSS的决策时,拥有相关、及时、干净、完整且可解释的数据是必不可少的。
此外,在其他医疗应用场景中,如预防医疗(特别是医疗保险)欺诈、推动医学研究(尤其是涉及异构数据集的整合)以及质量控制措施(如降低患者再入院率)等,这些数据质量维度也具有重要意义,但重要程度可能有所不同。例如,在降低患者再入院率的应用中,相关性可能比及时性更为重要。
一般来说,可解释性在所有应用中都很重要,尤其是在高风险或有法律影响的应用中,它可能变得至关重要。而及时性在某些应用中可能并非
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



