构建语义模型:警惕炒作与知识获取陷阱
在构建语义模型的过程中,我们常常会面临各种挑战和陷阱。许多语义和数据技术供应商,甚至一些学者,会声称使用他们的方法和工具构建语义模型非常容易。但事实并非如此简单,我们可以相对轻松地构建一个模型,但这不一定是我们真正需要的模型。
1. 需求重要性驱动质量策略
模型需求的重要性与可行性不同,它更多地取决于战略和业务因素,而非可用资源和技术。某些领域、市场或应用不可避免地比其他的更重要,而这些信息只有利益相关者才能提供。如果我们想构建出有用且有影响力的模型,就必须努力获取这些信息。
同时,我们要预料到在需求的重要性和程度上会存在矛盾的观点。例如,在某些公司内部,对于是否将软技能纳入知识图谱仍存在争议。
了解模型需求的相对重要性有助于我们确定所需遵循的质量策略。以牺牲更重要的需求为代价来优化低重要性需求的质量,注定会导致失败。可行性和重要性的结合有助于设定优先级,因为缺乏明确的优先级通常会导致时间和资源的浪费。
然而,我们要警惕“低垂果实”的暴政。理论上,需求的可行性与重要性是相互独立的,但在实践中,简单的需求往往会获得最高优先级,而困难的需求则被推迟。只要持续推迟的需求不会给模型带来重大的技术债务,这种做法是可以接受的。
2. 糟糕的知识获取
即使语义模型的需求被正确指定,其开发仍可能因未使用(或开发)正确的知识获取机制而受到影响。例如,我们可能在模型规范中明确表示希望在术语之间建立同义关系,但最终得到的只是相互关联的术语;或者我们想为模型实体获取文本定义,但在所选的数据中却找不到。这通常是因为我们使用了错误的知识来源和获取方法。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



