数据库语义基础的必要性探讨
在信息交流和数据处理的过程中,语义的一致性和准确性是至关重要的。然而,无论是自然语言还是形式语言,都存在着语义异质性的问题,这给数据的有效处理和共享带来了挑战。本文将深入探讨这些问题,并提出通过“接地”(grounding)过程来协调数据语义解释的方法。
1. 语义异质性的挑战
在人类的认知和交流中,对于身体及身体部位的命名需要达成共识。例如,像“妈妈”这样的名称,其共识可以基于可观察的动作,如指向动作,前提是相关情境能被同时观察,且语言教师和学习者的观点足够相似。语言社区通过社会训练向儿童灌输正确的词汇用法,即儿童对社会可观察情境做出明显反应的倾向,以及成年人对其话语进行奖励或惩罚的倾向。观察语句是语言学习的入口,因为它们可以通过指向直接学习,无需参考记忆或理论。
然而,人类的经验知识结构在很大程度上不受观察的严格约束,因此不同且不相容的现实概念化随时可能出现。这导致在一个本体中的抽象、难以观察的概念,在另一个本体中可能没有等效的对应物,使得翻译和本体映射在一定程度上是大胆的尝试。而且,对现实主义的承诺并不能解决语义异质性问题。
语义工程师在面对语义异质性问题时,虽然没有“上帝视角”,但可以参考集体经验,也有“真理”或“理性”的指引。
2. 自然语言使用的不确定性
有人可能认为,由于自然语言在对话中实际有效,似乎能完美约束词语和句子的预期含义,那么坚持使用自然语言描述就能解决语义异质性问题。确实,自然语言的某些部分的解释受到语言社区的强烈约束,例如约翰·塞尔指出,语言是构建社会现实的组成部分,用于建立“客观”的制度事实,如最高法院的判决或赋予一张纸“货币”的地位。
然
超级会员免费看
订阅专栏 解锁全文
20

被折叠的 条评论
为什么被折叠?



