
AI 教父有很多,但 AI 教母只有一个。如果没有她,黄仁勋还在卖游戏显卡,山姆奥特曼还在搞风投,库克还在挤牙膏,现在也在挤 only apple can do。深度学习之父辛顿教授说,她是第一位真正理解大数据力量的人,她打开了深度学习和 AI 技术的闸门。她就是美国三院院士斯坦福女王、全球 AI 华人之光李飞飞。她创办的ImageNet 是全球第一个大型 AI 数据库,是 AI 视觉研究的基石。她 33 岁成为斯坦福终身教授。
英伟达高级研究科学家、具身智能负责人金凡,还有曾在 Openai 主导 GPT4 的 Andrej Karpathy,都是他的学生。另外,他还担任过谷歌副总裁,推动成立了谷歌 AI 中国中心,叫他一声 AI 教母再合适不过了,但就是这样一位大牛,曾经却是去中餐馆打杂,每天从上午 11 点干到晚上 11 点,只为赚 24 美元贴补家用。那么李飞飞是怎么逆袭的?超群的智商时代的机遇固然重要,但更关键的恐怕要从他那不着调的父母讲起。
1976 年,李飞飞出生在北京的一个知识分子家庭,爸爸是工程师,妈妈是人民教师。这样的家庭按说应该玩命鸡娃两岁学外语, 3 岁弹钢琴,小学补物理,初中拼奥数,但这二位却非常不着调。先说他爸爸,老婆生孩子的当天,他竟然跑到公园去观鸟,完全忘了时间,错过了孩子的诞生时刻。李爸爸也觉得不好意思,那我给孩子好好起个名弥补一下,叫什么呢?就叫飞飞,我今在公园里看的那个鸟飞起来特好看,得,心思还在鸟身上呢。李爸爸的不着调不是一时的,他本身就是个离经叛道的人,他没有为人父的压力和焦虑,满脑子都是带孩子疯玩。他带小飞飞去公园看鸟,去田里捉昆虫,还会找来各种零件, DIY 出一辆带挎斗的自行车,载着小飞飞到处乱逛,就像一只没长大的猫,看见什么都想抓一抓。
李飞飞后来回忆说,爸爸就是个迷失在成年人身份中的大孩子,爸爸的不着调本质上是纯粹的好奇心,这反而成为李飞飞的科学启蒙,以至于上完物理课,他骑自行车拐弯时都要思考加速度和角动量的变化。爸爸不着调,妈妈怎么样呢?这么说,不是一家人不进一家门,妈妈身为人民教师,却天天让孩子看闲书,对教辅资料爱答不理,反把杂书闲书捧在手心上。初中时,有次小飞飞被叫了家长,班主任说别人家孩子都看奥数背单词,再不济也得翻翻意林读者文摘啥的,记点作文素材。你家孩子看的都是什么呀?不能承受的生命之轻,海洋生物UFO,这都不符合九年义务教育的课程价值观啊。你作为家长的得管,老师倒是一片苦心,可飞飞妈妈不干了。他像一头护犊子的狼,直接回怼,我家孩子就爱看这些书,有问题吗?这妈能处,有事真上啊,老师被噎得说不出话来。飞飞不只是爱看闲书,她还把头发剪得跟男生一样短,不穿裙子,天天跟一群男生聊战斗机和UFO。过了俩月,老师又坐不住了,又找家长。飞飞妈妈,我就直说了,飞飞可能挺聪明,但成功不光是靠智力,还要靠纪律。你看她天天打扮的跟个男生似的,像什么样子?她妈妈一点没怂,她说飞飞首先是个独立的个体,然后才是个女孩。老师叹了口气,那咱只说学习的事,他也得把个人兴趣放一边,专心学对未来最有用的东西啊。
这次飞飞妈妈没回怼,而是低下头,像是自言自语的说,这是飞飞想要的吗?这是我对她的期望吗?飞飞和我都不属于这里。没过多久,爸爸妈妈先后辞去工作,带着飞飞飞到美国新泽西州定居。那是 1992 年,飞飞刚满 15 岁不久,正是求知欲最旺盛的年纪。看上去一切都是最好的安排,但命运给予她的首先是狂风骤雨。
子女留学本来就是中产返贫三件套之一,而他们是一家人全过去了,什么工程师,人民教师,换个国家都是失业的失,直接从中产变成赤贫。三口人只能挤在只有一间卧室的公寓里,飞飞睡在厨房和用餐区的过道家具都是从垃圾堆捡来的,真是没苦硬吃。为了生计,飞飞爸爸去了一家华人开的店修照相机,妈妈去了一个商店当收银员,什么科学,什么文学,什么艺术,通通成了奢望。飞飞也很懂事,一放假就去打零工,比如去中餐馆打杂,每天从上午 11 点干到晚上 11 点,时薪只有两美元,生活已经够艰难了,学业更是雪上加霜。
飞飞几乎不会说英语,每天做作业都要准备两本词典,一本英译中,一本中译英,不然连作业都写不了。但就是这样的条件,飞飞还是凭借每天只睡 4 个小时的努力,高分拿下SAT、数学甚至。考了满分,但他这样的家庭条件,名校就算考上也读不起,只能读个州立大学或者社区大学。但在飞飞的内心深处有一个执念,始终放不下去。
读普林斯顿。那是一个很偶然的机会,爸爸带他出去玩,意外走进了普林斯顿大学。一开始他只是觉得这学校挺有钱,校园这么大,楼这么高,花花草草搞的也不错。但走着走着,他看到了一尊爱因斯坦的青铜半身像。飞飞说,当我辨认出是他之后,周围的世界似乎消失了。 1933 年,爱因斯坦从德国逃到美国,在普林斯顿高等研究院工作直到去世。飞飞的梦想是成为科学家,而爱因斯坦就是她的灯塔,从此追随爱因斯坦进入普林斯顿就成了她的执念。
虽然作为常春藤名校,普林斯顿的学费飞飞一家绝对付不起,但飞飞还是象征性的申请了一下,但谁都没想到,这象征性的一个申请竟然成功了,而且普林斯顿开出了几乎全额的奖学金。消息一出,整个社区都轰动了。哎呀,老李家那个刷盘子的姑娘要上普林斯顿了,就连当地的报纸都专门跑来采访报道标题就叫美国梦成真了。但是飞飞没有选他们认为能赚大钱的医学、金融等专业,而是选了自己最痴迷的物理。邻居们都不能理解,私下吐槽一张好彩票浪费了,学物理能有啥出息,真是没苦硬吃。
1995 年, 19 岁的李飞飞走进普林斯顿,成为天之骄女,但妈妈却累坏了身体,不能再出去打工了,于是一家人借钱开了家干洗店。周一到周五,飞飞是普林斯顿的高材生,满脑子都是物理研究,一到周末就穿上围裙在干洗店忙活。尽管忙成这样,她依然是全年级成绩最出色的学生之一。
一晃四年过去了, 1999 年,飞飞即将毕业,是找个班上还是继续读研呢?高盛、美林等华尔街巨头先登门招聘,只要飞飞入职起薪就是别人奋斗 5 年都达不到的水平。至于医保福利,晋升机会更不在话下。麦肯锡一看,孩子,你别着急,来我这,不用实习,直接给你长期正式岗位。这些offer,飞飞只要接住一个,全家人就再也不用吃苦了。但他们都提出了同一个条件,放弃科学。飞飞,这是你想要的吗?回家后,妈妈质问她,飞飞说,你知道的,我想要成为一名科学家。那还有什么好说的?妈妈的回应一针见血,飞飞要去读研了,继续逐梦科学。至于苦,这么多年都吃了,就再接着吃几年,她甚至赶在毕业前去了趟西藏,研究藏医,最终凭借藏医药学和西医学上的医理比较这一课题从 1, 200 多名竞争者中胜出,成为当年唯一获得普林斯顿 Martindale 1953 奖学金的人。
2000 年, 24 岁的李飞飞进入加州理工,成为钱学森和钱伟长的学妹,主攻的正是 AI 和视觉识别。从物理到 AI 跨度这么大,飞飞是怎么想?他在一次活动中自己解释过,因为他发现很多伟大的物理学家在生命的尽头思考的不是物质世界的问题,而是生命的问题,这引发他也逐渐开始关注生命的本质。
而人工智能距离生命最近,但当时 AI 研究已经停滞了很多年。科学家们前赴后继的努力提升模型和算法却一无所获,而李飞飞意识到只关注模型和算法没有用,还得把数据重视起来。这跟学数学一样,光训练逻辑思维没用,你要让他做足够多的题。回到 AI 视觉识别上,你想让机器识别出更多图片,就得先让机器学习海量的标注好的图片,他甚至通过阅读文献和参加研讨会得出了一个重要结论,视知觉依赖于分类,大脑会自然而然的把看到的细节归类为更广泛的概念。比如我们看到的是一团绿色和一大片蓝色的图案,大脑会把它归类为蓝天映衬下的一棵树。再比如我们看到的是一根细高的杆子,上面在发光,大脑会把它归类为路灯。所以要想让 AI 视觉更智能,首先要让他见过各式各样的路灯。
2005 年,李飞飞博士毕业,先在伊利诺伊大学香槟分校做了一年多助理教授。 07 年回到普林斯顿开始做 AI 研究,终于圆了科学家的梦。当时 AI 有很多热门方向,但他偏偏选了最不被看好的计算机视觉识别。读书期间,他就意识到,要提高视觉识别的准确性,不能只关注算法,还得把数据重视起来,要给计算机提供足够多足够准确的图片。而且他在加州理工也实践了,带着几个本科生手敲出来一个有 101 个分类, 9, 000 多张图片的数据集,叫 CALTECH 101,在科研圈还引发了不大不小的关注。现在有条件了,必须要做大做强,再创辉煌。他要创建一个能完全反映真实世界、全面推动 AI 研究的数据集。同事一听,呦,您这想法不错,赶紧放弃吧。他们倒不是打击飞飞,而是视觉识别这个科研方向太冷门了,不但拉不到经费,还可能因此一辈子评不上教授。飞飞自己也说:当时在 AI 圈,算法是绝对的当红炸子鸡,而数据却无人问津,仅仅被视作训练工具,跟小孩玩的玩具一样。而且要想实现飞飞的设想,需要的图像分类可就不是 101 个了,而是3万个。当时有好几个本科生帮忙,他们还吭哧吭哧干了两年,如果没有资金支持,按照这个进度,3万个至少要干 600 年。
飞飞说,她在听到够用一辈子的劝阻声后,终于遇到了一位支持者。当时普林斯顿计算机科学系教师中唯二的中国移民李凯。李教授是位芯片创业者,以 20 亿美元卖掉自己的公司后才转型搞学术。他站在商业化的视角,非常认可飞飞的观点。孩子,别怕,我先给你买套工作站拿去用。我还有个学生叫邓佳,脑子挺好使,以后让他跟你干。 07 年,在李教授和邓佳的支持下,飞飞的数据集终于启动了,这就是ImageNet。他规划了 22, 000 个类别,每个类别配 1, 000 张图,一共 2, 200 万张,这还只是成品,为了选出这 2, 200 万张,需要先找到至少 10 亿张,这工作量绝对是天文数字。好在找图标注没啥技术含量。他们雇了一群本科生,每小时 10 美元做一个无情的标注机器。但即便如此,ImageNet 完工也得整整 19 年。为了提高效率,飞飞和邓佳想了不少办法,比如优化图片下载流程,原本需要点三下鼠标给它压缩到一下搞定。再比如自动在谷歌输入图片类别,提高下载速度,一顿操作猛如虎,到头来预计只能把 19 年的开发周期压缩到 18 年,还因为下载太多被谷歌封了账号。
其实要提速也简单,撒钱招人就行了,但每小时 10 美元是个天文数字,而且他们也没有多大的办公场地可用。ImageNet 逐渐陷入僵局,飞飞甚至想过开几家干洗店赚钱养开发。但很快有个大聪明找过来,他叫孙民,是普林斯顿的研究生。孙民问飞飞,你听说过众包吗?就是可以远程分配工作,全世界的人都可以同时参与,而且价格绝对比线下找本科生便宜,亚马逊上就有这种服务。
还有这种好东西拿来,你自从转向众包模式,飞飞团队的标注员就开始指数级增长,最多时有来自 167 个国家的 4.8 万人参与,开发时间也从十几年压缩到 5 年、两年和不到一年。胜利就在眼前。但很快兜里先没了钱,开干洗店肯定来不及了,还是得找金主爸爸。
2009 年年初,飞飞带邓佳跳槽到斯坦福。当年6月,ImageNet 的初始版本问世,收录了 1, 500 万张图片,涵盖 22, 000 个类别,而且每张图片都经过了手工标注,并在层次结构中进行了组织,经过了三重验证。总而言之,这绝对是一个划时代的产品。
飞飞非常兴奋,不久后带着ImageNet 去参加计算机视觉与模式识别大会,要向全世界秀肌肉。他还特意定制了一批带 logo 的笔,准备在会场发一发,结果刚到现场就被通知,对不起,飞飞女士,你的演讲被取消了。ImageNet 只能在会场边的海报上展示,这给飞飞气的生气耽误时间。先给路过的人讲讲,毕竟来参会的都是内行,但是对他们感兴趣的也没几个,整个团队唯一受关注的就是那批带 logo 的笔,因为做的确实好看。飞飞说,无论是被证明路线是对的还是错的,我都做好了准备,但万万没想到,我们被忽略了。
怎么才能让学界认可ImageNet 挨个往大会跑肯定不现实,有没有什么更巧妙的办法呢?在纽约州立大学实习分校助理教授,同时也是飞飞的小迷弟。亚历克斯的提示下,飞飞想到了一个绝的:办比赛,号召全球的 AI 算法从业者用ImageNet 训练他们自己的模型,最后比一比谁的效果更厉害,这样既能提高知名度,还能在各类算法模型的测试中优化自己,一箭双雕。不过早就有人这么干了,比如 Pascal VOC 就是年度计算机视觉大赛的基础数据集,从 05 年就开始办比赛,几乎成了图像数据库的行业标准。人家为什么要参加你新办的比赛呢?别说,还真有理由。因为 Pascal 只有 1 万多张图,而ImageNet 有 1, 500 多万张,绝对能吊打。
说干就干。经过几个月的筹备, 10 年5月,首届ImageNet 大型视觉识别挑战赛正式开放报名一下就收到 150 份报名表。飞飞的心情比参加ImageNet 发布会时还激动,他在自传中说,发布产品是我们向世界展示自己创造的东西,而现在,世界将向我们展示他们用ImageNet 创造的东西。但到了9月 1 统计结果,他就发现自己白激动了。
获胜的算法是当时公认的行业标准,而且识别率改进也不大,相当于你拿出一套教材和练习册,自称可以颠覆过去的学习方式。结果班里学生练了仨月一考试得第一的还是上次考试那位状元,连分数都没咋变。那你这套教材还有啥可吹的呢?到 11 年第二届比赛报名人数直接从100。 50 人掉到 96 人,比赛结果跟上一年也差不多。飞飞说,这种经历令人羞愧,福不双至,祸不单行。飞飞怀孕了,关键是她跟丈夫希尔维奥是异地婚姻,根本得不到照顾。飞飞的孕期反应还特别大,医生告诫她在分娩前都不能出门。但ImageNet 不可能停下来,她只好天天在家办公,手机震个不停,一天夜里,手机再次震动。不是ImageNet 有了新进展,而是她的高中恩师萨贝拉病重了。
萨贝拉是飞飞在美国的高中数学老师,在她因为成绩差而崩溃的时候,因为英语障碍无法融入集体的时候,因为移民身份被欺负的时候,都是塞贝拉老师鼓励他,引导他。后来飞飞家要开干洗店,但手头没钱,塞贝拉老师还主动借钱帮忙,他早已不只是一位老师,更是飞飞的第三位家长。如今,他细胞瘤晚期即将去世,飞飞却不能参加葬礼。事业受挫,身体不适。亲人故去,飞飞徘徊在崩溃的边缘。 12 年8月,飞飞终于诞下小宝宝。一个多月后,她又接到一个电话,是她的战友邓佳:
“飞飞,第三届比赛的结果出来了,获胜的是个老古董。” “老古董是什么意思?就是神经网络算法。神经网络不可能。” “真的,而且准确率比上届冠军高10%。”
飞飞说从接到这个电话起,他们家就陷入混乱,因为他必须要丢下孩子去见见这个团队。这个团队的老大我们都很熟了,就是嘉宾商学起底过的辛顿教授团队开发的算法模型 Alexnet 在这次比赛的识别准确率达到85%,创下历史记录,真的。一夜之间,这个错误率一下子就减半了,这是怎么做到的?更奇怪的是, Alexnet 属于卷积神经网络,这是一个 20 多年都没啥进展的算法方向。辛顿坐冷板凳都快坐出痔疮了,这究竟是出现了神奇还是辛顿撞了大运?都不是?这其实是科学界的一次风云际会。简单说,神经网络的思路相当于模拟人脑,模拟生物进化,比如视觉识别的算法,都是预先决定先找图片的哪些特征,而 Alexnet 没有预设,完全靠训练数据学习来培养自己的敏感度,逐渐形成对世界的认知。跟婴儿认知世界的方式一样,我们也可以把它比作足球。别的算法的思路是找规划球员,找国际大牌教练或者设计战术,都是针对球队本身见效比较快。而神经网络的思路是从娃娃抓起,通过普及足球运动,多建足球场,发展青训体系,把足球土壤培养好,过程肯定慢,也会消耗巨量的资源,但是一旦做成了,效果将是前者无法比拟的。
辛顿教授之所以坐 20 年冷板凳,不是因为神经网络的思路有问题,而是他缺少资源,其中最核心的是算力和数据,而ImageNet 恰好提供了足够多的数据,内置了酷大的英伟达GPU,又恰好提供了超强算力。这次科学界的风云际会成就了李飞飞,证明了辛顿,造福了黄仁勋。 Alexnet 的成功让神经网络成为 AI 主流。两年后,机器的人脸识别准确率正式超越人类。李飞飞用大数据训练神经网络的想法也被业内疯狂追捧,从图像扩展到语音、文字、视频等其他领域, AI 革命被彻底点燃。 2012 年,李飞飞成为斯坦福终身在职的副教授,但他会趁着休假到企业去实践。比如 17 年1月到 18 年9月的休假期间,李飞飞出任谷歌副总裁,推动成立了谷歌 AI 中国中心,这也是谷歌在亚洲设立的第一个 AI 研究中心。再比如,今年1月开始,他又迎来了两年的长假,这次他选择创业,在4月创办了Wordlabs,仅 3 个月估值就突破 10 亿大关,还获得了黄仁勋的投资。科技的未来又多了一个被期待的理由。但如果你认为李飞飞的价值观是技术至上,那可大错特错。相对于技术,他更关注人性和尊严。
人工智能设计的伦理问题已经来了。
他认为掌握 AI 不是特权,而是责任。当别人沉醉于让 AI 更聪明,更便于商业化时,他却参与创办了斯坦福大学以人为本 AI 研究院,推动以人为本的 AI 技术,用 AI 造福世界,保护弱者,就是她的下一颗北极星。
819

被折叠的 条评论
为什么被折叠?



