读书笔记∣元数据:用数据的数据管理你的世界 Ch.3-4

第三章 描述性元数据

1、都柏林核心元数据元素集

(1)都柏林核心元数据元素集从最底层常见的共同特征开始构建元数据集,包括15个核心元素集:


创建都柏林核心元数据集的初衷是描述互联网资源,但得益于采用了最底层常见的共同特征,因此常用来描述实体资源。

(2)描述性记录

一条元数据记录了一个资源,描述性元数据记录可以用于多种目的,但是最重要的用途之一是“资源发掘”。资源发掘工具是一种帮助用户发现资源的技术,例如,网络搜索引擎、图书馆卡片式目录资源发掘可以实现的原因在于元数据记录中的元素-值配对,每个元素-值配对就是所谓的接入点,利用发掘工具从这个入口可以去发掘可用于记录描述的资源。为了让都柏林核心元数据元素成为最底层常见的共同特征,它必须可以用来描述一切事物,不仅所有的元素都是可以重复的,而且任何不相关的元素都可以排除在记录之外。

(3)都柏林核心修饰词

都柏林核心元数据元素集旨在成为最底层常见的共同特征的元数据元素集,但最底层常见共同特征的问题在于有时层级过低,某些用例可能需要超过15种元素,为此,人们通过三种方式扩展了都柏林核心元数据集。

  1. 建立术语集:由现有的15种核心元素增加了由40个术语组成的集合。例如已修改(modified)、部分为(haspart)、部分于(ispartof)等。
  2. 运用修饰词:修饰词特定于个体的单独元素可更加精准的解读或细化元素的含义。例如:

实际上,所有的这些修饰词都以都柏林核心元数据术语的形式存在,即“已创建created”、“已修改modified”和“有效valid”。这些对日期元素的具体细化用处很大,在建立元素集后发明的第一批修饰词就包括了这些术语,后来则被纳入术语集中。术语集一直在不断演化中,这种演化之所以能得以延续,是因为所有术语、元素和修饰词的构建都必须基于都柏林抽象模型,抽象模型是主谓宾陈述的数据模型,具体说明了这些主语、谓语和宾语背后的概念以及如何将这些元素结合成模型图表,这种逻辑模型基于“资源描述框架RDF”。

           3、借助编码体系来澄清对某一元素值的解读。

(4)网页中的元数据

最为常见的在线对象非网页莫属,网页主要以文本编写而成,往往嵌有图片、视频和其他媒体,并且为了在浏览器中显示而采用html编码的文档。网络中的文档与其他事物一样

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值