视觉显著性计算:从人类视觉到计算机应用
在当今信息爆炸的时代,我们每天都会接收到海量的视觉信息。据统计,我们每天所接收的信息中,有 80% 来自视觉系统。每一秒,我们的视网膜就能接收到高达 100 亿比特的信息,然而大脑皮层的神经元总数仅约 100 亿(Shepherd, 2003)或 200 亿(Koch, 2004)。这表明我们接收的视觉信息量远远超过了大脑的存储能力,而且大脑的处理能力也有限,无法同时对所有输入的视觉信息进行复杂分析。
什么是视觉显著性
为了说明视觉显著性的概念,我们以 Jimmy 为例。Jimmy 是一名大学研究员,他的一天十分忙碌。早上吃早餐时看报纸,开车去实验室的路上留意周围安全情况,工作时查看进度报告和观察仪器,下班后看篮球比赛和电视。在这个过程中,他的视觉系统始终在工作。
由于视觉信息过多,人类视觉系统的一个核心任务就是高效地检测重要的视觉子集,即显著子集。这些子集能够迅速凸显出来,并利用大脑有限的计算资源进行优先处理,而其他子集则常常被抑制甚至忽略,以提高处理效率。
为了进一步探究人类大脑的信息处理能力,我们将其与世界上最快、最强大的超级计算机进行比较。2013 年 11 月的报告显示,富士通的“K 计算机”是世界上第四强大的超级计算机。但在 2013 年 8 月,日本和德国科学家利用“K 计算机”的 82944 个处理器和 1PB 的内存,模拟了 17.3 亿个神经元通过 104 万亿个突触连接的活动,这仅相当于人类大脑约 10% 的神经元和 1% 的连接。在模拟中,超级计算机计算 1 个生物秒的神经元活动大约需要 40 分钟。而一个神经元每秒大约只能放电 200 次,计算机处理器每秒却能进行数十亿次浮点运算(比神经元快数百
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



