信息的信任、真实性与结构描述
1. 数据库保存的挑战与应对
数据库工程任务复杂。若要在与原环境不同的数据库管理系统(DBMS)软件中复用数据库,除了表格数据,还需保留数百个表之间的关系。为了在不保存整个DBMS的情况下重现其行为,元数据必须包含高级DBMS特性的描述,如约束断言、触发器、用户定义函数、访问控制规则等。虽然SQL标准长达2000多页,且不同DBMS产品对其遵循程度不同,但仍可使用SQL。
在传统财务报告系统中,数据库快照相当于资产负债表,日志相当于财务日记账,数据库管理程序相当于记录交易的规则集。然而,对于变化速度快于快照构建速度的信息,如汽车比赛摄影中的信息,以及广泛分布且伪随机变化的信息,获取其瞬时状态快照存在实际困难。例如,要捕捉万维网的瞬时状态是不可能的,像谷歌等搜索服务和互联网档案馆等保存服务,需要数天或数周来采样感兴趣的网络空间,并告知用户其数据收集只是对特定网络状态的近似表示。
除了上述情况,保存数据库状态、时间序列或性能与保存其他数据面临的技术挑战并无不同。关键在于选择要保存的实例或实例序列,这适用于任何类型的信号或现实世界情况。对于数字文档,其含义比模拟记录或现场表演更简单,因为数字状态大多是静态的,而现实世界的表演是连续的。
2. 信任与真实性的判断
我们最多信任自己感知到的信息,或者信任他人告知的特定类型信息。在保存架构中,我们应考虑谁来决定信任以及何时做出决定。人们认为的原始版本或有价值的衍生版本,要么是主观选择,要么是受主观选择的社会规则引导的客观选择。
任何真实性判断都是将手头的实例与与历史事件相关的特定先前实例进行比较,这种比较基于(近似)完整性和真实来源。一份文档要具有真
信息保存与真实性验证的关键技术
超级会员免费看
订阅专栏 解锁全文
70万+

被折叠的 条评论
为什么被折叠?



