这个人是世界上最会骗人的教授,他总能想出有趣的点子,设计有趣的游戏,“骗”你为他干活。
最妙的是,全世界的人都心甘情愿地“上套”。
01
第一个“骗局”:标记图片
我们都知道,计算机通常无法直接理解图像,比如说,你想在网上搜索兔子的图片,只有正确标注了“兔子”标签的图片才能被找到。
不幸的是,数以百万计的在线图片和视频要么标签错误,要么描述拼写错误,因此搜索引擎几乎不可能找到它们。
怎么才能给这些图片打上有意义的标签呢?
2003年,路易斯(Luis von Ahn)在卡内基梅隆大学读博士,他的研究方向是“人机计算”,意思是将人类智力与计算机相结合,就可以解决任何一方都无法单独解决的问题。

为了验证他的想法,路易斯设计了一个叫做ESP的游戏。
这个在线游戏极其简单,用户登录后,会随机分配一个伙伴,两人互不相识,也无法交流。
然后系统给双方展示同一张图片,两个游戏者的任务就是输入可能的词或者短语来描述这张图片,如果双方达成一致,那个这个词、短语就会被用来描述这幅图片。

新奇的体验很快吸引了上百万的玩家,两年时间内就有3000多万幅图片被标注。
你可能觉得这种方式比较粗糙,比起李飞飞十年后来建立的ImageNet在分类和准确上差远了,但是这种打标签的方式对于搜索引擎来说足够了。

比如下面这幅图片,人们给它打的标签是:guys sitting music,有了这些标签,搜索引擎就足以把它找出来,展示给用户了。

2005年是路易斯大获成功的一年,他的毕业论文《Human computation》获得了卡内基梅隆大学计算机学院的最佳博士论文奖。
同时,他发明的ESP游戏技术也被Google看上,将其收购,并将其更名为Google Image Labeler。
02
第二个“骗局”:验证码
早在2000年,路易斯就和同事一起发明了验证码,有效地阻止了“机器人”自动注册,发广告的难题。

但是验证码对用户影响巨大:我们不得不眯起眼睛,小心翼翼地输入这些单词,输错了就得重来一遍。
路易斯看到这种情况,又开始琢磨了,既然用户费了这么大劲,为什么不把“识别单词”这个事儿给利用起来,让它产生价值呢?
比如有很多书籍,想数字化进入电脑的时候,就得用OCR技术扫描。
但是对老旧书籍,字体模糊,OCR也识别不了,那能不能让人来识别呢?
比如有个单词是fox,在书中模糊看不清了,那就形成图片,当作验证码让用户来识别。
用户A看到了,识别成了"fxx"
用户B看到了,识别成了"fox"
用户C看到了,识别成了"foc"
用户D看到了,识别成了"foo"
每个用户都有自己的识别结果,系统可以在后台做交叉验证,如果发现大多数用户都输入了fox,那fox就可以认为是是正确的词。
这样用户付出的劳动变成了有价值的“人肉OCR”。
可是,这么弄验证码的话有个巨大的漏洞:因为系统也不知道正确答案,机器人就可以随意输入了!
路易斯就想了另外一招,每次展示两个词。
一个词是系统已知的,当作真正的验证码。
另外一个词是系统不确定的单词,让用户做人肉OCR。
举个例子,下图中的morning这个词OCR识别不了,就把它当成不确定的词,让用户识别。
与此同时,再提供一个系统已经知道的词“overlooks”,当作验证码。

只有那些正确地输入了overlooks的用户,系统才认为这是一个真人,才会对他输入的另外一个词做进一步处理(例如交叉验证)。
2007年,路易斯发表了一篇论文,把这种验证码称为reCAPTCHA。
reCAPTCHA 不仅提升了网络安全,还充分利用了广大网民的劳动,确实是一个精妙的发明。
2009年,Google看到reCAPTCHA在大规模数字化项目(如图书数字化、档案整理等)上的潜力,把它收购了,开始了一个雄心勃勃的Google图书馆项目,计划将世界上的每一本书都数字化,创建一个供所有人访问的数字图书馆。
截至2019年,Google利用扫描技术和reCAPTCHA,一共录入了4000万种书籍,非常惊人。
03
第三个“骗局”:Duolingo
连续成功“欺骗”两次以后,路易斯决定再干一票大的。
在什么行业折腾比较好呢?
他想起来了自己求学经历,出生在危地马拉,这个中北美洲国家非常贫穷,但是路易斯的妈妈却在教育上倾其所有,让他就读于危地马拉的美国学校,与危地马拉富人和外国外交官的子女一起就读,8岁时就给他买了Commodore 64 计算机,从此路易斯对计算机产生了浓厚的兴趣。

教育太重要了,创业就做教育方向!
当年他申请杜克大学时,不得不花费 1200 多美元飞往邻国萨尔瓦多参加托福考试,这笔巨款让他无比感慨:考试行业真是压榨学生啊!
所以就做语言教育,颠覆这个行业!
路易斯延续了reCAPTCHA的思路,建立了一个叫做Duolingo的“众包翻译”网站。

这个网站上有各种语言(英语、法语、德语、中文......)的课程,用户学完课程以后,会遇到一些翻译练习,这些句子并不是随便写的,而是来自真实的文章(比如CNN的新闻文章、BuzzFeed的网站内容),系统把同一段文字分配给多个学习者,采纳最合理的结果。
更妙的是,翻译的结果可以再卖给CNN、BuzzFeed赚钱!
很多人笑称:在Duolingo,大家一边学习,一边被“骗去打工”。
学习者得到免费学习,企业得到低成本翻译,这种双赢的模式虽然听起来很好听,但是不太适合扩展,像CNN、BuzzFeed这样的客户太少,从长期来看,这种“劳动变现”的故事很酷,但并不符合教育产品的核心。
2014年,Duolingo逐渐将盈利的重点转向广告、考试(Duolingo English Test)和后来的订阅服务(Duolingo Plus/Super)。
不过Duolingo那种游戏化学习的方式,得到了很好的保留:
每次学习都是一个“关卡”;
练习有经验值(XP)、连胜天数(streak);
失败时会扣除“lives”,需要重新挑战;
用户可以和朋友竞争排名。
这种机制让学习语言变成了刷游戏,很多人本来只是随便试试,却被连续打卡的 streak 机制“套牢”。
有用户 streak 了 1000 多天,生怕断掉,于是出国时宁愿用漫游网络也要继续练习。
如果你注册了,但不学习,Duolingo的催促机制也非常诙谐幽默,有网友晒 streak 破千的截图,评论区全是“我不敢停,怕猫头鹰半夜来我家”。
每次我看到Duolingo发的邮件,都会忍不住会心一笑,点开链接,再去学一会儿。

2013 年,苹果公司将 Duolingo 评选为年度 iPhone 应用,这是教育类应用的首例。
2014年,Duolingo Crunchies 大赛中荣获最佳教育初创公司奖,并且是 2013 年和 2014 年 Google Play 中下载次数最多的“教育应用”。
2018,2019年入选CNBC“50大颠覆者”榜单。
2020 年 7 月,《个人电脑杂志》将其评为“最佳免费语言学习应用”
如今,Duolingo支持43种语言的课程和认证,从热门的语言(英语,法语,德语)到濒临灭绝的语言(夏威夷语,纳瓦霍语等)都有覆盖,甚至还有《权力的游戏》中的高等瓦雷利亚语(High Valyrian)和《星际迷航》中的克林贡语(Klingon)!

Duolingo 的用户群体,也超出了创始人最初的预期,从发展中国家的低收入群体,到中学大学的学生,甚至在欧洲难民潮期间,很多叙利亚难民用 Duolingo 免费学习德语和英语,以便融入新的环境。Duolingo 因此被 NGO、联合国等机构推荐。

路易斯说:“我们最自豪的不是市值,而是有数以百万计的人因为 Duolingo 改变了人生轨迹。”
04
总结
从标记图片,到验证码,再到学习语言,路易斯这三次“欺骗”都获得了巨大的成功。
而这一切背后的的核心思想,就是路易斯的博士论文《Human computation》:把一些计算机难以完成,但人类很擅长的任务,通过某种方式分配给人来做,然后把结果汇总起来,就好像是人类在“充当计算机的一部分”。
用这种方式,把每个人微不足道的碎片时间和好奇心利用起来,汇集成不可阻挡的洪流。
这就是最了不起的骗局,它不仅没有伤害,反而形成了推动世界进步的力量。
人机协作的智慧骗局
616

被折叠的 条评论
为什么被折叠?



