视觉理解与问题解决:从基础概念到实际应用
1. 问题求解与知识运用
在解决问题的过程中,我们常常需要依据特定的分类链和知识模式。例如,对于图 7.19 的问题,可基于分类链… ⊃νAni ⊃νCho ⊃νMam = {νEle, νOx, νRab, νTig, …} 来求解。从这个分类链中,我们能推断出大象、牛和兔子属于哺乳动物。同时,从动物分类… ⊃νAni … {νFis, νAmf , νRep, νAve, νMam} 中可以选出鱼类和哺乳动物这两个不同的类别。
而解决图 7.20 中的任务时,则需要参考知识模式。每个类别都有其知识模式,它定义了该类别对象的主要属性。以动物的物理属性知识模式为例,它能提供动物体重的信息,体重以三个值(最小值、平均值、最大值)给出。当图 7.20 中的对象被命名后,每个对象的属性(如体重)可从由动物名称所指示的类别知识模式中获取。对于大象或兔子等动物,知识模式会给出其体重值。要解决“将这些对象按从轻到重排列”的任务,可先找出每个动物的平均体重,然后根据体重对动物名称进行排序。
graph LR
A[动物分类链] --> B[推断动物所属类别]
C[知识模式] --> D[获取动物属性]
D --> E[解决排序任务]
2. 视觉 - 文本任务类别
视觉 - 文本任务有多种类别,下面详细介绍几种常见的类别。
2.1 视觉 - 图形 - 命令 - 文本任务类别
视觉 - 图形 - 命令 - 文本任务(TT FVAcC </
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



