读书笔记4

读论文《从基于知识的视觉系统到认知视觉系统》有感:

这篇论文是我从知网上下载的英文论文,下面是我翻译阅读后的心得体会:

      该篇论文围绕对计算机视觉的研究先是简要的概述了当前的视觉系统及其任务以及局限性,之后介绍了基于知识的视觉系统,描述了显性知识(Explicit Knowledge)是如何产生的。计算机视觉的研究和应用起源于20世纪60年代,它是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。由于当时固有的计算资源的限制,以及其他原因,导致研究不再以人工智能和通用识别为目标,而是针对受限场景完成简单任务。在过去的几十年里,机器学习技术的发展为视觉系统的显著进步做出了贡献。然而,大多数应用程序依赖于纯自下而上的方法,这些方法需要大量的训练数据,并且不能很好地概括新数据。在这项工作中,作者团队调查了过去十年中开发的与计算机视觉系统相关的知识。从中得出结论,显性知识的使用有助于改善一些计算机视觉任务。将显性知识与图像数据相结合,可以开发基于自底向上和自上而下的视觉学习方法的应用程序,类似于人类视觉。研究表明,与视觉系统相关的知识对数据的依赖性更小,精确度更高,鲁棒性更强。计算机视觉系统的最终目标是具有通用图像解释和语义分析的能力描述。为此,团队很早就发现了几何表示的局限性,因为它们不能处理对象可能具有的大量变化和模型,包括有关一个物体的功能(称为启示)。这些模型是基于心理学家吉布森的启示概念,指出人类根据物体的可用性来理解物体。在里面除了实现更好的对象识别,启示还可以提供有关场景上下文的信息。了解图像中的场景组成(存在哪一组对象)可以提高识别能力。例如,一个房间里有多件餐具图像可以帮助识别厨房图像。这种关系是双向的,就像上下文知识一样还提供有关场景中对象功能的见解,减少传感器噪声或遮挡的影响。在这种情况下,可以通过识别厨房环境来识别单个餐具。其他认知科学领域的研究也表明,对周围世界的视觉理解超越了视觉,概念知识的整合也不容忽视。概念知识总结我们对这个世界的了解,比如从以前的经历中学到的东西。明斯基认为框架可以提供一个关于视觉的整体理论,通过提出,被称为框架的记忆结构,可以对知识进行编码,类似于人类如何记住识别新情况所需的信息根据以前的经验。通过结构化和简洁的方式组织知识,信息可以被重新访问和存储适应现实。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值