元数据质量评估:框架与应用
1. 引言
元数据是为了提升特定系统的功能,而添加到信息中的数据。例如,在书目记录中添加书架位置,方便图书馆读者查找书籍;在学习对象描述中加入教育背景,便于选择合适的学习材料;在计算机文件信息中包含最后修改日期,使用户能进行高级搜索。基于元数据的系统性能,在很大程度上依赖于元数据的特性。高质量的元数据能使系统按预期运行,而低质量的元数据则可能导致系统故障。
传统上,质量被定义为对象的内在卓越程度。但在元数据领域,质量不仅取决于记录的客观内部特征,还与特定实践社区的需求和使用方式相关。例如,日文元数据记录在日本图书馆可能被认为是高质量的,但对于大多数不懂日语的美国图书馆用户来说则毫无用处。此外,元数据质量还受其使用的技术环境影响。因此,现代研究者将元数据质量定义为其支持系统功能需求的能力,即“适用性”。
为了理解元数据质量对基于元数据的信息系统的影响,需要明确元数据的主要功能。在图书馆系统中,国际图书馆协会和机构联合会(IFLA)确定了元数据参与的四项活动:
- 查找相关元素(如搜索特定时间段内的所有文章);
- 识别元素或区分元素(如区分两个标题相同的学习对象);
- 选择最合适的元素(如选择图书馆中可用的书籍版本);
- 获取所选元素的访问权限(如提供所需在线资源的URL)。
此外,现代基于元数据的信息系统还赋予了元数据新的用途:
- 聚类元素(如根据歌曲特征推荐相似音乐);
- 提高系统效率(如通过哈希检测图像重复)。
元数据质量与它对这六项活动的促进程度直接相关。当前元数据质量研究的主要目标是了解不同元数据特征如何影响用户查找、识别、选择和获取所描
超级会员免费看
订阅专栏 解锁全文
1020

被折叠的 条评论
为什么被折叠?



