元数据结构概述
基本元数据结构
本部分规定的描述基础教育资源的数据组合被划分成不同的类别。信息模型根据描述学习对象的数据元素(LOM V1.0基本模式)由以下9个不同的类别组成。
――通用:组合了对教育资源进行整体描述的通用信息;
――生存期:组合了与教育资源的历史和当前状态有关的特征以及在演化期间已经影响该教育资源的个人和组织;
――元数据:组合了元数据实例本身(不是元数据实例描述的教育资源)的信息;
――技术:组合了教育资源的技术要求和技术特征;
――教育:组合了教育资源的教育和教学特征;
――权利:组合了教育资源的知识产权和使用条件;
――关联:组合了定义在教育资源与其他相关教育资源之间的相互关系的特征;
――评价:组合了对教育资源在教育使用上的一些评论,以及这些评论的作者和创作时间的信息;
――分类系统:描述了教育资源在学科体系中所处的位置。
数据元素
本部分的元素定义方法采用 GB/T 18391的元数据元素描述方法。这一正式的描述标准不仅改善了核心元数据与其他元数据描述的一致性,同时也对改善其元素定义的明晰性、范围以及内部的一致性有很大作用。
对每个数据元素,标准的信息模型都定义了下列内容﹕
——名称:数据元素的名称及其对应的英文名称;
——解释:对数据元素的释义;
——约束:对数据元素约束状态的描述,包括必备或可选数据元素;
——大小:允许的值的个数;对数据元素可重复的限定指标;
注:可能包含最低峰值。
——次序:值的次序是否有意义(只适用于具有列表项的数据元素,见5.3);
——示例:一种说明的例子。
对于简单数据元素,标准信息模型也定义了:
——值空间:数据元素的取值范围。一般以分类代码表或者引用另一个标准/规范的形式出现;
——数据类型:能表达数据值的数据元素的类型指标;指明数据元素的值是多语言字符串、日期时间、分类代码表或未定义。
注:可能包含最低峰值。
对信息模型的扩展应该保留简单数据元素的值空间和数据类型。
列表项
在元数据实例中,某些数据元素的值可以不是一个单一的值,而是一个列表。列表应该是下面两种类型之一:
——有序的:值的先后次序是有意义的。例如:在全部贡献者的列表中,第一贡献者或最主要、最重要的贡献者,应该排在其他贡献者之前;
——无序的:值的先后次序没有意义。例如:对于资源的适用对象,包含数个短文词语,其间没有次序关系,它们之间的次序变换不会丢失任何信息。
最低峰值
最低峰值的定义适用于如下两种情况:
——具有列表项的数据元素:所有处理LOM实例的应用程序至少应该能够处理最低峰值所规定的列表项数。即应用程序一般会定义所能处理列表项数的一个上限值,该值不能小于最低峰值;
——数据类型为字符串或多语言字符串的数据元素:对于数据元素中的字符串,所有处理LOM实例的应用程序至少应该能处理最低峰值所规定的字符串长度。即应用程序一般会定义所能处理字符串长度的一个上限值,该值不能小于数据元素的数据类型所规定的最低峰值。
字符集
本部分定义了元数据的一个概念上的结构,没有规定绑定、编码和表示上的问题。
表示
对于每一个数据元素,本部分规定了取值的数据类型。
本部分没有定义元素名称或分类代码表中取值的符号表示。这些表示将在与本部分对应的绑定标准中定义。
一致性
元数据实例的一致性
元数据实例的一致性如下:
——一个与本部分严格一致的元数据实例只能由本部分的数据元素组成。元数据实例应该包含所有的必备数据元素,可以包含可选数据元素,但不能包含扩展数据元素;
——一个包含了所有的必备数据元素,但每个数据元素都没有取值的LOM实例是一个一致的实例。
元数据的一致性
元数据的一致性如下:
——一个与本部分严格一致的元数据应用程序应该能够支持所有的必备数据元素,可以支持可选数据元素,但不能直接支持扩展数据元素;
——一个与本部分一致的元数据应用程序应该能够支持所有的必备数据元素,可以支持可选数据元素,也允许支持扩展数据元素;
——一个与标准一致的元数据应用程序应该能够支持包含了所有的必备数据元素,但每个数据元素都没有取值的LOM实例。
注:“支持”的含义依赖于具体的应用程序。
信息模型及元素属性
表7-1定义了BERM信息模型的基本结构及其元素属性。
表 STYLEREF 1 \s 7‑ SEQ 表 \* ARABIC \s 1 1 BERM信息模型的基本结构及其元素属性
编号 | 类别名称 | 解释 | 约束 | 大小 | 次序 | 值空间 | 数据类型 | 举例 |
1 | 通用,general | 该类别描述了学习对象的一些通用信息 | M | 1 | — |
|
|
|
1.1 | 标识符,identifier | 所描述教学资源的唯一标识 | M | 1 | 否 |
|
|
|
1.1.1 | 类别,catalog | “1.1.2 表项”所属标识方案或编目方案的名称或指示符。一种命名方案 | M | 1 | — | GB 13000—2010的字汇 | 字符串*(1 000个字符) | “ISBN” “URI” |
1.1.2 | 表项, entry | 在标识或编目方案中用于标识此学习对象的标识符。一个与名域相关的字符串 | M | 1 | — | GB 13000—2010的字汇 | 字符串*(1 000个字符) | “ISBN7-309-04547-5” “ http://so.eduyun.cn/seachResult?trueKey=true&searchType=SL001&keyword=ISBN7-309-04547-5” |
1.2 | 标题, title | 所描述的教学资源的名称 | M | 1 | — |
| 多语言字符串*(1 000个字符) |
|
1.2.1 | 正式标题, proper title | 对教学资源内容的揭示具有关键意义的主要名称 | M | 1 | — |
| 多语言字符串*(1 000个字符) | (“zh”“诗词五首”) |
1.2.2 | 其他标题,alternative title | 正式标题之外的其他名称或替代写法 | O | *10 | — |
| 多语言字符串*(1 000个字符) | (“zh”“《次北固山下》赏析”) |
1.3 | 语种,language | 资源知识内容所使用的语言类型 | M | *10 | 否 | 推荐遵循RFC1766 [RFC1766]所规定的代码 , 使用GB/T 4880.1-2005 的2个字母的语言代码。如en代指英语,fr代指法语,而en-uk代指英式英语。 中华民族语言资源推荐遵循《中国图书馆图书分类法》 | 参照基础教育教学资源元数据服务平台(http://md.eduyun.cn/) 字符串 *(100个字符) | “zh” “en” “fr-CA ” |
1.4 | 描述,description | 以文本方式对资源内容的简介 | M | *10 | 否 |
| 多语言字符串 | 通过基础知识运用、整体理解、课内语段阅读、课外拓展演练、读后研习等环节,全面掌握理解课文的重点知识。” |
1.5 | 关键字, keyword | 用以描述资源主要内容的关键词语 | M | *10 | 否 |
| 多语言字符串 *(1 000个字符) | ( “气密性”) |
1.6 | 覆盖范围,coverage | 资源所涉及的时间、文化和地理区域。资源内容的范围和广度,覆盖主要包括空间位置、时间段 | O | *10 | 否 |
| 多语言字符串 | ( “2015湖北黄冈”) |
2 | 生存期,life cycle | 该类别描述了资源的历史和当前状态以及那些对资源的发展过程发生作用的实体 | M | 1 | 一 |
|
|
|
2.1 | 版本,version | 教学资源的版本状态 | O | 1 | — |
| 多语言字符串 *(50个字符) | (“Demo”) ( “公开测试版”) |
2.2 | 贡献,contribute | 在资源的生存周期中为其发展做出贡献(创建、编辑、发行等)的实体(人或组织) | M | *30 | 否 |
|
|
|
2.2.1 | 贡献者,contributor | 对元数据实例做出贡献的实体(人或组织)的标识及相关信息 | M | *10 | 是 | vCard,由IMC vCard 3.0(RFC 2425, RFC2426)定义 | 字符串 *(1 000 个字符) | Begin: vCard\nFN:孙默\nTel:01066490916\nTitle:总编\nEnd: vCard\n” |
2.2.2 | 角色,role | 贡献的类型。注:至少应该描述资源的作者 | M | 1 | — |
| 多语言字符串 *(1 000个字符) |
|
2.2.3 | 日期,date | 与资源本身生命周期中的一个事件相关的日期 | M | *5 |
| 遵循GB/T 7408-2005,ISO 8601-2000 | 日期时间 | “2013-06-16” |
3 | 元—元数据,meta-meta data | 该类别描述了元数据实例自身(不是元数据所描述的资源)的信息 | M | 1 | — | 遵循GB/T 21365—2008中此项元素的内容与结构。 | BERMS2.0 |
|
4 | 技术technical | 该类别描述了资源的技术要求及其相关特征 | M | 1 | — |
|
|
|
4.1 | 格式,format | 资源在技术上的数据类型。该数据元素用于确定资源所需的运行软件 | M | *40 | 否 | 建议采用来自于受控词表中的值,GB/T 28825-2012 | 参照基础教育教学资源元数据服务平台(http://md.eduyun.cn/) |
|
4.2 | 使用环境,requirement | 使用资源所需要的技术条件,如:硬件、软件、网络等 | O | 1 | — |
| 多语言字符串*(1 000个字符) |
|
4.3 | 大小,size | 数字化资源的大小,用十进制数字“0”到“9”表示,单位是字节(每字节8位),不是兆字节等。该数据元素表明了资源的实际大小,如果资源经过压缩,则该数据元素的值是未压缩时的大小 | O | 1 | — | GB/T 1988-1998,但只包括数字“0”到“9” | 字符串*(30个字符) | “8500” |
4.4 | 位置,location | 用于表明如何获取资源的字符串。它可能是一个位置(如:URL),或解析出位置的一种方法(如:URI)。最可取的位置优先列出 | O | *10 | 是 | GB 13000—2010的字汇 | 字符串*(1 000个字符) | “http://www.cbern.gov.cn/derscn/portal/SearchAction.do?method=catalog&catalog_type=teach” |
4.5 | 持续时间,duration | 所需要的时间。注:该数据元素对音频、视频和动画等资源尤为有用 | O | 1 | — |
| 持续时间 | “PT40M30S” |
5 | 教育,educational | 该类别描述了资源在基础教育和教学方面的一些关键特征 | M | *100 | — |
|
|
|
5.1 | 学习方式,learning mode | 该资源所适用的学习行为,体现学生在自主性、探究性和合作性方面的基本特征 | O | *10 | 是 | 参照基础教育教学资源元数据服务平台(http://md.eduyun.cn/) |
|
|
5.2 | 资源类型,learning resource type | 描述该资源的一般范畴、功能、种属或聚类层次,越主要的类型越先列出 | M | *5 | 是 | 参照基础教育教学资源元数据服务平台(http://md.eduyun.cn/) | 字符串*(1 000个字符) |
|
5.3 | 适用对象,Applicability | 该资源所适应的范围 | M | *10 | 是 |
|
|
|
5.3.1 | 用户类型,audience | 该资源的主要使用者,最重要的优先列出 | M | 1 | — | 参照基础教育教学资源元数据服务平台(http://md.eduyun.cn/) | 字符串*(1 000个字符) | “学龄前儿童” |
5.3.2 | 年级,grade level | 该资源所适用的学生的年级特征描述 | O | *20 | — | 参照基础教育教学资源元数据服务平台(http://md.eduyun.cn/) | 字符串*(1 000个字符) | “高中二年级” |
5.3.3 | 使用建议,suggestion | 针对用户类型对如何使用该资源进行描述 | O | 1 | — |
| 多语言字符串*(1 000个字符) | “可作为扩展资料使用。” |
6 | 权利,rights | 该资源本身所有的或被赋予的权限信息。包括对一个资源的权限声明,或是对提供这一信息的服务的参照 | O | 1 | — |
|
|
|
6.1 | 版权,copyright | 描述该资源的版权形式和所有者 | M | 1 | — |
| 多语言字符串 |
|
6.2 | 限制,restrictions | 该资源使用的条件和范围 | O | 1 | — |
| 多语言字符串 |
|
7 | 关联,relation | 该资源与其他资源的关系 | O | *100 | — |
|
|
|
7.1 | 关联类型,relationship | 该资源与关联资源之间的关系 | M | 1 | — | 参照基础教育教学资源元数据服务平台(http://md.eduyun.cn/) | 字符串*(1 000个字符) |
|
7.2 | 关联资源,resource | 与该资源关联的资源通用信息 | M | 1 |
|
|
|
|
7.2.1 | 标识符identifier | 与该资源关联的资源标识 | M | 1 | 否 |
|
|
|
7.2.2 | 类别,catalog | “7.2.1 标识符”所属标识方案或编目方案的名称或指示符。一种命名方案 | M | 1 | — | GB 13000—2010的字汇 | 字符串*(1 000个字符) | “ISBN”“URI” |
7.2.2.1 | 表项,entry | 在标识或编目方案中用于标识此教学资源的标识符。一个与名域相关的字符串 | M | 1 | — | GB 13000—2010的字汇 | 字符串*(1 000个字符) | “ISBN7-309-04547-5”“http://www.ncet.edu.cn/res/04547” |
7.2.2.2 | 描述,description | 与该资源关联的资源内容标签 | M | 1 |
|
| 字符串*(1 000个字符) |
|
8 | 评价,annotation | 对资源在教学使用方面的一些评价。该类别能使教育者共享其对资源的评价和使用建议等 | O | *100 | — |
|
|
|
8.1 | 评价者,annotator | 创建评价的人或组织机构 | M | 1 | — | vCard,由IMC vCard 3.0(RFC2425、 RFC2426)定义 | 字符串*(1 000个字符) | “Begin: vCard\nFN:孙默\nTel:01066490916\nTitle:总编\nEnd: vCard\n” |
8.2 | 描述,description | 评价的内容 | M | 1 | — |
| 多语言字符串*(1 000个字符) | ( “关于小数意义的理解,通过对图像的分割,表示小数0.1,0.01等”) |
8.3 | 日期,date | 创建评价的日期 | O | 1 | — |
| 日期时间 | “2015-9-17” |
9 | 分类系统,classification system | 所描述的教学资源的所属学科类别及其主要内容 | M | 1 | 否 |
|
|
|
9.1 | 学科名称,curriculum name | 资源内容的学科名称 | M | 1 | 否 | 参照基础教育教学资源元数据服务平台(http://md.eduyun.cn/) | 字符串*(1000个字符) |
|
9.2 | 课程标准,curricular standard | 描述该资源与国家课程标准内容框架的对应关系 | M | 1 | 否 | 参照基础教育教学资源元数据服务平台(http://md.eduyun.cn/) | 字符串*(1000个字符) |
|
9.3 | 教材目录,textbook code | 描述该资源与教材内容框架的对应关系 | O | *10 |
| 参照基础教育教学资源元数据服务平台(http://md.eduyun.cn/) | 字符串*(1000个字符) |
|
9.4 | 专题教育资源,special subject | 在实施教育教学的过程中,专门研究或讨论的题目 | O | *10 | 否 | 专题教育分类代码表 | 参照基础教育教学资源元数据服务平台(http://md.eduyun.cn/) |
|
注1:“约束”栏内M表示必备数据元素、 O表示可选数据元素。 注2:“大小”和“数据类型”栏内有星号标记的为最低峰值。 |
多语言字符串
下表定义了多语言字符串的结构。
多语言字符串
编号 | 名称 | 解释 | 约束 | 大小 | 次序 | 值空间 | 数据类型 | 示例 |
1 | 多语言字符串,Multilingual string | 用于表示一个或多个字符串的数据类型。一个多语言字符串的值可以包含多个语义相同的字符串,如:不同的翻译或选择性的描述 | O | *10 | 否 |
|
|
|
1.1 | 语种,language | 字符串所使用的人类语言。注:索引或编目工具可以提供有效的默认值,如:用户界面所使用的语言 | O | 1 | — |
| 字符串*(100个字符) |
|
1.2 | 字符串,string | 实际的字符串 | M | 1 | — | GB 13000.1—2010的字汇,不包括NUL—字符(UCS字符U00000000) | 字符串 | 范仲淹诗《苏幕遮》的朗诵。 |
注1:“约束”栏内M表示必备元素、O表示可选元素。 注2:“大小”和“数据类型”栏内有星号标记的为最低峰值。 |
日期时间
下表定义了日期时间的结构。
日期时间
编号 | 名称 | 解释 | 约束 | 大小 | 次序 | 值空间 | 数据类型 | 示例 |
1 | 日期时间,date time | 精度至少能达到1秒的时间点 | O | 1 | — | 格式:YYYY[-MM[-DD[Thh[:mm[:ss[.s[TZD]]]]]]] 其中: ——YYYY=用 4位数表示的年(≥ 0001); ——MM=用 2位数表示的月( 01到 12,其中01=一月,以此类推); ——DD=用 2位数表示的日( 01到 31,取决于对应的月和年); ——hh=用 2位数表示的小时( 00到 23,不允许使用 am/pm); ——mm=用 2位数表示的分( 00到 59); ——ss=用 2位数表示的秒( 00到 59); ——s=用 1位或多位数表示的 1秒的十进制小数; ——TZD=时区指示符(“Z”表示 UTC或+hh:mm或-hh:mm)。 该数据元素至少要包含4位数的年。如果包含日期时间的其他部分,字符“-”“T”“:”和“.”属于日期时间字符表示的一部分。 如果出现时间部分,但是时区指示符没有出现,那么默认的时区是 UTC。 注1:该值空间基于GB/T 7408—2005。 注2:方括号这个元字符(“[”、“]”)表示可选元素,该元素可以在日期时间的字符表示中出现0次或1次。这些元符号不在结果中出现,只有它们所描述的相关值才会出现在结果中。如:“DD”用相应的2位数日期进行替换。 | 字符串*(200个字符) | “2007-03-18T16:30:25+01:00”(2007年3月18日,下午4点30分25秒,与UTC时差为1小时)” |
2 | 描述,description | 对日期的描述 | O | 1 | — |
| 多语言字符串*(1 000个字符) |
|
注1:“约束”栏内M表示必备元素、O表示可选元素。 注2:“大小”和“数据类型”栏内有星号标记的为最低峰值。 |
分类代码表
下表定义了分类代码表。
分类代码表
编号 | 名称 | 解释 | 约束 | 大小 | 次序 | 值空间 | 数据类型 | 示例 |
1 | 来源,source | 指定取值来源 | O | 1 |
|
| 字符串 *(1 000个字符) |
|
2 | 值,value | 实际值。在 GB/T 18221—2000的术语中,如果取值列表的值有隐含的次序关系,那么这些值被“枚举”;如果没有隐含的次序关系,那么这些值被“陈述” | M | 1 |
|
| 字符串 *(1 000个字符) |
|
注1:“约束”栏内M表示必备元素、O表示可选元素。 注2:“大小”和“数据类型”栏内有星号标记的为最低峰值。 |