专访 Swin Transformer 作者胡瀚:面向计算机视觉中的「开放问题」 原创

文 | 刘冰一、Echo
编辑 | 极市平台
本文原创首发于极市平台,转载请获得授权并标明出处。

胡瀚,湖北潜江人,本博均毕业于清华大学自动化系,曾就职于百度研究院深度学习实验室,目前任职于微软亚洲研究院视觉计算组。近期他和团队的“ Swin Transformer:Hierarchical Vision Transformer Using Shifted Windows ” 摘得 ICCV 2021 马尔奖(最佳论文奖)。

1 从看闲书谈起

科研人员闲暇做什么?也许千人千面。胡瀚在微软亚洲研究院工作,周末他偏好窝在家里看书作消遣。此外,他在工作日早晚也会挤出一段时间用来阅读。最近在看先秦两汉时代的书,翻着翻着他脑海里会闪现一些和工作中的互通之处。比如,那时诸子百家百花齐放,制度创新层出不穷,但这些思想和制度的创新大都是在前人的基础上进行的改进,以此适应最新的社会经济变化。他感慨做研究最好要做到心中有基准线,了解历史的演进过程以及目前支撑技术和生态的变化,这样才能更好地指引研究前进的方向。

《送东阳马生序》中有一句话:「幼时即嗜学,家贫,无从致书以观」。胡瀚的情况跟这有些相似,他从小便喜欢读书,兴趣浓时废寝忘食,索性村里小学的图书馆加一张床,每天泡在书海里。虽然后来学了理科,但他的阅文比较广泛,古今中外兼容并包,他最爱在历史书中索趣,他认为梳理历史脉络有助于树立“大局观”和“联系思维”。

“全局意识”对他学业和科研助益颇深。在思考问题的时候,他常常能够从眼前孤立的局部跳出来,探讨在更大的图景中对正确方向的把握。 比如博士期间做视觉分割问题,他打破常规的纯工程角度,试图从人的视觉机制中寻找灵感,以指导和启发新算法的设计,这样最终形成的博士论文不再是纯工程模块的罗列,而是形成了更体系性和前瞻性的思考。

胡瀚对历史有许多自己的思考。说起喜欢的历史人物,他钦佩对人类思想变革有贡献的人,比如宣扬知行合一的王阳明;从底层做起、人格完整的的富兰克林,他的价值观智慧且实在;以及杰斐逊,时值美国建国思想大变革之际,他的政治理念和实践对人类社会的贡献功不可没。开卷有益,博览群书,无功利目的地海量阅读,使他形成了宽厚的知识塔基和灵敏的心智结构,从而在科研输出时尽量“知识自由”“引证自由”。

《卡萨布兰卡》里写到,「你如今的气质里,藏着你走过的路,读

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值