31、数据、元数据与叙事:文化数据管理与职业 ICT 教育课程开发的挑战与对策

数据、元数据与叙事:文化数据管理与职业 ICT 教育课程开发的挑战与对策

1. 数据处理与人文研究的困境

在数字图书馆系统及更广泛的计算领域,数据处理是一个关键问题。人们天生有从数据中构建叙事的冲动,同时又倾向于认为所发现的数据是“原始的”,未受叙事影响。然而,现实并非如此。所谓的“数据清理”过程,实际上是一个既细化又模糊的过程,它会突出某些方面,同时掩盖其他方面。

在科学领域,数据清理是标准操作,但记录往往不完整。而在人文学科中,数据清理很少受到关注和认可。人文学科对于数据的定义、数据如何成为数据、是否需要清理以及原始语境、抽象化和重新语境化在数据处理中的作用等问题存在诸多矛盾和困惑。

例如,语义和语境复杂的文化数据是人文学者研究的重点,但在信息系统管理和策展方面却面临巨大问题。如何捕捉和整合这种不确定性、不规则性和丰富性,而不将其隐藏起来?谁能判断什么是“信号”,什么是“噪音”?谁能确定哪些关键信息仍然缺失?

2. 数据清理的影响与 EOS DIS 模型

数据清理的决策对研究结果、解释、重用和复制有着深远影响。虽然数据清理在科学领域被视为理所当然,但在人文学科中却缺乏相关的探讨和记录。

NASA 的地球观测系统数据信息系统(EOS DIS)为数据处理提供了一种功能性的定义。它不仅承认材料成为数据所经历的处理层次,还对清理过程进行分层,同时保持对“原始数据”来源语境的可追溯性。

不过,EOS DIS 模型也存在问题。它提到了“0 级”之前的“原始数据”,但这个术语存在问题,且该模型仅适用于研究开始时数据收集的阶段,之后数据被视为原始数据,直到进一步处理。而且,目前尚不清楚该模型用于人文学科研究时会是什么样子,人文学科中也缺乏与之类似的明确数据分级。

3. 数据处理面临的挑战列表
  • 人文学科对数据处理缺乏关注和认可,导致数据处理过程不透明。
  • 数据清理决策的记录不完整,影响研究结果的可重复性。
  • 难以判断文化数据中的“信号”和“噪音”,以及确定缺失的关键信息。
  • EOS DIS 模型在人文学科中的适用性有待验证,且“原始数据”术语存在问题。
4. 数据处理问题的关系流程图
graph LR
    A[数据清理决策] --> B[影响研究结果]
    B --> C[可重复性问题]
    D[人文学科对数据处理不重视] --> E[数据处理不透明]
    E --> C
    F[文化数据复杂性] --> G[难以判断信号和噪音]
    G --> H[关键信息缺失]
    I[EOS DIS 模型] --> J[在人文学科适用性待验证]
    I --> K["‘原始数据’术语问题"]
5. 职业 ICT 教育面临的挑战

在全球标准化的 ICT 领域,职业教育课程需要平衡快速发展的国际标准与独特的当地文化传统和社会经济需求。以阿富汗为例,尽管 ICT 领域需求旺盛,但职业教育机构提供的课程往往缺乏针对性,低资质的教师倾向于照搬大学课程,而雇主对职业学校毕业生的能力有不同期望。

由于全球化带来的国际标准化影响,ICT 领域的知识和职业概况不断变化,职业教育系统需要不断更新课程以符合国际标准。同时,课程设计也应考虑当地的文化和社会经济因素。

6. 本体驱动的课程开发方法

为了解决上述挑战,提出了一种基于本体驱动的职业 ICT 教育课程开发方法,使用如语义 MediaWiki 和概念图等易于使用的语义网络工具。

参考模型是一种通用的元模型,具有诸多优势。它可以让开发者考虑对象及其关系的标准,便于利益相关者之间的沟通,节省时间和成本,还能帮助课程开发者将大问题分解为小问题。

该研究的核心问题是:语义技术如何在发展中国家(如阿富汗)的职业 ICT 课程开发过程中,平衡国际资格和能力标准与当地文化和社会经济因素的要求?研究通过利用领域本体和相关语义网络技术,使数据结构和组织更易于发展中国家职业学校的 ICT 教师理解。

7. 参考模型的优势表格
优势 说明
考虑标准 使开发者能够考虑对象及其关系的标准
便于沟通 方便利益相关者之间的沟通,节省时间和成本
分解问题 帮助课程开发者将大问题分解为小问题进行解决
8. 职业 ICT 课程开发流程 mermaid 图
graph LR
    A[明确国际标准和当地需求] --> B[开发本体驱动的参考模型]
    B --> C[使用语义工具组织数据]
    C --> D[设计课程]
    D --> E[课程实施与评估]
    E --> F[根据反馈调整模型和课程]

数据、元数据与叙事:文化数据管理与职业 ICT 教育课程开发的挑战与对策

9. 文化数据管理的建议措施

为了实现文化数据的有意义可发现性,可采取以下措施:
- 推动数据标准化 :应在现有标准化趋势的基础上,将可能促进不同文档之间意外关联发现的信息自动提升并存储为链接开放数据,而不一定是对元数据方法进行标准化。
- 强化数据来源记录 :要基于现有的研究数据管理(RDM)来源工作,如 W3C 来源标准等,更严格地记录和共享数据转换信息,就像通过“数据护照”追溯数据到当前状态的历程,使我们不仅能获取当前的数据,还能了解其演变过程。
- 促进资源融合 :需让文化遗产机构的查找工具与讨论相关馆藏的二次文献相结合。目前科学出版商与文化遗产机构的分离,严重阻碍了利用学术成果丰富目录大数据的机会。
- 纳入隐藏数据 :必须认识到并非所有对人类文化研究有价值的内容都能或将会被数字化。数字记录需要以某种方式纳入数字视角下隐藏的内容,这虽具挑战性,但将是未来学术研究的关键基础。

10. 建议措施的重要性表格
措施 重要性
推动数据标准化 促进不同文档间的关联发现,提升数据的可利用性
强化数据来源记录 确保数据的可追溯性,提高研究的可靠性和可重复性
促进资源融合 整合文化遗产机构与学术资源,丰富研究数据
纳入隐藏数据 避免只研究数字化数据,使研究更全面地反映人类文化
11. 文化数据管理措施实施流程图
graph LR
    A[推动数据标准化] --> B[强化数据来源记录]
    B --> C[促进资源融合]
    C --> D[纳入隐藏数据]
    D --> E[实现文化数据有意义可发现性]
12. 本体驱动课程开发的预期效果

通过本体驱动的职业 ICT 教育课程开发方法,有望实现以下效果:
- 提升课程质量 :使课程更符合国际标准和当地需求,提高职业学校毕业生的就业竞争力。
- 增强教师参与度 :使用易于操作的语义网络工具,降低教师参与课程开发的难度,提高他们的积极性和参与度。
- 促进知识共享 :便于不同利益相关者(如教师、雇主、校友和院长)之间的知识共享和交流,推动职业 ICT 教育的发展。

13. 预期效果的对比表格
效果 未采用本体驱动方法 采用本体驱动方法
课程质量 缺乏针对性,与国际标准和当地需求不匹配 符合国际标准和当地需求,提升就业竞争力
教师参与度 低,难以参与课程开发 高,易于参与课程开发
知识共享 困难,信息流通不畅 便捷,促进知识交流和共享
14. 本体驱动课程开发效果实现流程图
graph LR
    A[开发本体驱动参考模型] --> B[提升课程质量]
    A --> C[增强教师参与度]
    A --> D[促进知识共享]
    B & C & D --> E[推动职业 ICT 教育发展]
15. 总结

文化数据管理和职业 ICT 教育课程开发都面临着各自的挑战。在文化数据管理方面,数据处理的不透明、清理决策记录的缺失以及文化数据复杂性带来的判断难题等,都需要通过一系列措施来解决。而在职业 ICT 教育课程开发中,平衡国际标准与当地需求是关键,本体驱动的方法为解决这一问题提供了有效的途径。通过实施相关措施和方法,有望提升文化数据的可发现性和职业 ICT 教育的质量,推动相关领域的发展。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值