元数据研究:让数字资源重获价值?
1. 引言
“元数据”如今在学术界和专业领域都成了常用术语。用谷歌学术搜索该词,结果超100万条;用普通谷歌搜索,结果超3000万条。不过,元数据在定义、创建、管理和存储等方面存在很大异质性,这或许是因为缺乏精准定义来概括元数据技术应用的核心要素。
从词源上看,元数据常被定义为“关于数据的数据”。虽该定义没错,但涵盖范围过广,且只抓住了部分关键要素。比如,在纸上记录本地图书馆某本有趣书籍的数据,这也算元数据。这引出了元数据研究的一些重要问题,像有人认为元数据仅适用于数字信息,还有人觉得元数据需有某种模式或结构,以实现网站和系统间的标准化或统一使用。此外,“元数据”而非“元信息”这个术语得到了更广泛的应用。尽管数据、信息和知识概念不同却相互关联,但这里我们遵循通用用法,将元数据作为元信息的统称。
在网络诞生前,元数据就已存在。但网络让元数据成为网络空间架构的核心。最初,网络仅由简单互联的HTML页面构成,如今已演变得极为复杂,元数据与页面内容融合,或作为一层信息通过URI指向被描述的资源。而且,HTML不再是网络信息描述的唯一方式,XML、RDF以及一些微格式成为如今元数据的主要表达媒介。对于不同领域的从业者和研究者来说,理解元数据及其在网络中的呈现形式是一项关键技能。
2. 元数据作为研究学科
近年来,“元数据研究”的说法逐渐兴起,有人自称“元数据专家”,也有国际项目围绕“元数据聚合”展开。但元数据研究是否算一门独立学科很难界定,因为没有相关学会或专业组织对其进行定义。虽有一些标题含“元数据”的学术期刊和相关会议,但明确该领域的边界颇具挑战。
元数据研究的对象也难以清晰定义。一种可能
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



