人工智能领域的突破与思考
在多伦多市中心谷歌大楼十五层的办公室里,有一个独特的测试。办公室柜子上放着两个白色的块状物,形似鞋盒,它们是一个金字塔的两半。当有人走进办公室,会被要求将这两半重新拼成金字塔。看似简单的任务,却难倒了很多人,就连两位麻省理工学院的终身教授也未能成功。
这个测试揭示了人类视觉理解的复杂性。人们通常是从整体的三维视角去认识物体,而这个谜题的切割方式干扰了人们以常规的三维方式去想象金字塔,这也正是计算机视觉研究中被忽视的事实。
当前计算机视觉研究主要依赖深度学习,但深度学习只能解决部分问题。例如,一个神经网络分析数千张咖啡杯照片后,可能学会识别咖啡杯,但如果照片仅展示了咖啡杯的侧面,它就无法识别倒置的咖啡杯,因为它只能从二维角度看待物体。
为了解决这些问题,Geoff Hinton提出了“胶囊网络”(capsule networks)。胶囊网络和其他神经网络一样,是从数据中学习的数学系统,但它能赋予机器和人类一样的三维视角,让机器在只学习了一个角度的物体外观后,就能从任何角度识别该物体。这个想法最早在20世纪70年代末提出,几十年后在谷歌得以复兴。2015年,Hinton原本计划在DeepMind研究胶囊网络,但因妻子Jackie被诊断出癌症而搁置。回到多伦多后,他与伊朗研究员Sara Sabour一起探索这个想法,并在2017年秋天构建了一个胶囊网络,其识别陌生角度图像的准确率超过了普通神经网络。胶囊网络不仅仅是一种图像识别方法,它试图以更复杂、更强大的方式模拟大脑的神经元网络,有望推动人工智能在计算机视觉、自然语言理解等多个领域的发展。
2019年3月27日,Hinton、LeCun和Bengio荣获图灵奖,该奖项被誉为“计算机领域的诺贝尔
超级会员免费看
订阅专栏 解锁全文
1385

被折叠的 条评论
为什么被折叠?



