语义模型模糊化与词汇化的抉择
1. 语义模型模糊化的考量
语义应用在没有额外研发的情况下,并不总是能够处理和利用真值程度。不过,经过适当设计和调整底层算法,模糊化模型在语义标注、消歧、语义搜索和匹配等任务中可能会有所帮助。
1.1 何时进行模糊化
对语义模型进行模糊化并非易事,主要原因在于获取和维护真值程度的难度和成本较高,而且缺乏标准的模糊语义建模框架。在决定是否进行模糊化之前,需要回答以下问题:
- 模型中哪些元素不可避免地存在模糊性?
- 对这些模糊元素的真实性存在(预期)的分歧有多严重和有多大影响?
- 这些分歧是由模糊性还是其他因素引起的?
- 如果模型元素具有模糊程度,是否会减少分歧?
- 使用该模型的应用程序能否利用和受益于真值程度?
- 是否能够开发一种可扩展的方法来获取和维护模糊程度,且成本低于它们带来的收益?
前三个问题用于评估模糊性问题的规模。第一个问题很重要,因为对于没有模糊性的模型,考虑模糊化没有意义。第二个问题反映了虽然我们都知道模糊性可能是个问题,但在实际中,直到测量其后果,我们才真正知道它到底有多严重。例如,如果不同的人对“大预算”的构成存在严重分歧,并且这种分歧显著减慢了决策过程,那么真值程度可能会有所帮助。可以通过让不同的人对同一组陈述进行真假判断,然后应用一些统计一致性度量方法(如Cohen’s Kappa)来测量分歧程度。同时,需要密切监测模型在实际中的使用方式以及它对应用程序和流程的影响,以测量这些分歧的影响。
第三个问题需要确保分歧问题的根源不是由不确定性或歧义引起的,否则模糊化将既不合适也无帮助。
接下来的两个问
超级会员免费看
订阅专栏 解锁全文
1751

被折叠的 条评论
为什么被折叠?



