视觉显著性计算:从人类视觉到计算机应用
1. 什么是视觉显著性
在日常生活中,我们无时无刻不在使用视觉系统获取信息。以Jimmy为例,他每天早晨吃早餐时“读”报纸,开车去实验室的路上“看”周围环境确保安全,工作时“查看”进度报告、“观察”仪器获取实验结果,下班后“看”篮球比赛、“看电视”结束一天。实际上,我们每天接收的信息中约80%来自视觉系统。每秒钟,视网膜能接收多达100亿比特的信息,但大脑皮层的神经元总数仅约100亿(Shepherd, 2003)或200亿(Koch, 2004)。这表明我们接收的视觉信息量远远超过了大脑的存储能力,而且大脑的处理能力也有限,无法同时对所有输入的视觉信息进行复杂分析。
为了解决这些问题,人类视觉系统的一个核心任务是高效地检测重要的视觉子集,即显著子集。这些子集能迅速凸显出来,并利用大脑有限的计算资源进行优先处理,而其他子集则常被抑制甚至忽略,以提高处理效率。
为了进一步探究人类大脑的信息处理能力,我们将其与世界上最快、最强大的超级计算机进行比较。2013年11月的报告显示,富士通的“K计算机”是世界第四强大的超级计算机。然而,2013年8月的一项新突破表明,日本和德国科学家利用“K计算机”的82,944个处理器和1PB内存来模拟17.3亿个神经元通过10.4万亿个突触连接的活动,这仅相当于人类大脑约10%的神经元和1%的连接。在模拟中,超级计算机计算1个生物秒的神经元活动大约需要40分钟。要知道,神经元每秒大约只能放电200次,而计算机处理器每秒可以进行数十亿次浮点运算(即比神经元快数百万倍)。当我们为大脑的能力感到自豪时,不禁会问:拥有数十亿慢速神经元的神经网络如何能显著超越超级计算机?一种可能的解释是,大量输入信号在进入大脑高级区域之前
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



