全世界的聪明人，心甘情愿地被这个小国的教授骗了三次！

人机协作的智慧骗局

原创于 2025-09-04 08:56:07 发布 · 800 阅读

9 ·

CC 4.0 BY-SA版权

转载请联系原作者授权，微信onlyliuxin97

这个人是世界上最会骗人的教授，他总能想出有趣的点子，设计有趣的游戏，“骗”你为他干活。

最妙的是，全世界的人都心甘情愿地“上套”。

第一个“骗局”：标记图片

我们都知道，计算机通常无法直接理解图像，比如说，你想在网上搜索兔子的图片，只有正确标注了“兔子”标签的图片才能被找到。

不幸的是，数以百万计的在线图片和视频要么标签错误，要么描述拼写错误，因此搜索引擎几乎不可能找到它们。

怎么才能给这些图片打上有意义的标签呢？

2003年，路易斯（Luis von Ahn）在卡内基梅隆大学读博士，他的研究方向是“人机计算”，意思是将人类智力与计算机相结合，就可以解决任何一方都无法单独解决的问题。

为了验证他的想法，路易斯设计了一个叫做ESP的游戏。

这个在线游戏极其简单，用户登录后，会随机分配一个伙伴，两人互不相识，也无法交流。

然后系统给双方展示同一张图片，两个游戏者的任务就是输入可能的词或者短语来描述这张图片，如果双方达成一致，那个这个词、短语就会被用来描述这幅图片。

新奇的体验很快吸引了上百万的玩家，两年时间内就有3000多万幅图片被标注。

你可能觉得这种方式比较粗糙，比起李飞飞十年后来建立的ImageNet在分类和准确上差远了，但是这种打标签的方式对于搜索引擎来说足够了。

比如下面这幅图片，人们给它打的标签是：guys sitting music，有了这些标签，搜索引擎就足以把它找出来，展示给用户了。

2005年是路易斯大获成功的一年，他的毕业论文《Human computation》获得了卡内基梅隆大学计算机学院的最佳博士论文奖。

同时，他发明的ESP游戏技术也被Google看上，将其收购，并将其更名为Google Image Labeler。

第二个“骗局”：验证码

早在2000年，路易斯就和同事一起发明了验证码，有效地阻止了“机器人”自动注册，发广告的难题。

但是验证码对用户影响巨大：我们不得不眯起眼睛，小心翼翼地输入这些单词，输错了就得重来一遍。

路易斯看到这种情况，又开始琢磨了，既然用户费了这么大劲，为什么不把“识别单词”这个事儿给利用起来，让它产生价值呢？

比如有很多书籍，想数字化进入电脑的时候，就得用OCR技术扫描。

但是对老旧书籍，字体模糊，OCR也识别不了，那能不能让人来识别呢？

比如有个单词是fox，在书中模糊看不清了，那就形成图片，当作验证码让用户来识别。

用户A看到了，识别成了"fxx"

用户B看到了，识别成了"fox"

用户C看到了，识别成了"foc"

用户D看到了，识别成了"foo"

每个用户都有自己的识别结果，系统可以在后台做交叉验证，如果发现大多数用户都输入了fox，那fox就可以认为是是正确的词。

这样用户付出的劳动变成了有价值的“人肉OCR”。

可是，这么弄验证码的话有个巨大的漏洞：因为系统也不知道正确答案，机器人就可以随意输入了！

路易斯就想了另外一招，每次展示两个词。

一个词是系统已知的，当作真正的验证码。

另外一个词是系统不确定的单词，让用户做人肉OCR。

举个例子，下图中的morning这个词OCR识别不了，就把它当成不确定的词，让用户识别。

与此同时，再提供一个系统已经知道的词“overlooks”，当作验证码。

只有那些正确地输入了overlooks的用户，系统才认为这是一个真人，才会对他输入的另外一个词做进一步处理（例如交叉验证）。

2007年，路易斯发表了一篇论文，把这种验证码称为reCAPTCHA。

reCAPTCHA 不仅提升了网络安全，还充分利用了广大网民的劳动，确实是一个精妙的发明。

2009年，Google看到reCAPTCHA在大规模数字化项目（如图书数字化、档案整理等）上的潜力，把它收购了，开始了一个雄心勃勃的Google图书馆项目，计划将世界上的每一本书都数字化，创建一个供所有人访问的数字图书馆。

截至2019年，Google利用扫描技术和reCAPTCHA，一共录入了4000万种书籍，非常惊人。

第三个“骗局”：Duolingo

连续成功“欺骗”两次以后，路易斯决定再干一票大的。

在什么行业折腾比较好呢？

他想起来了自己求学经历，出生在危地马拉，这个中北美洲国家非常贫穷，但是路易斯的妈妈却在教育上倾其所有，让他就读于危地马拉的美国学校，与危地马拉富人和外国外交官的子女一起就读，8岁时就给他买了Commodore 64 计算机，从此路易斯对计算机产生了浓厚的兴趣。

教育太重要了，创业就做教育方向！

当年他申请杜克大学时，不得不花费 1200 多美元飞往邻国萨尔瓦多参加托福考试，这笔巨款让他无比感慨：考试行业真是压榨学生啊！

所以就做语言教育，颠覆这个行业！

路易斯延续了reCAPTCHA的思路，建立了一个叫做Duolingo的“众包翻译”网站。

这个网站上有各种语言（英语、法语、德语、中文......）的课程，用户学完课程以后，会遇到一些翻译练习，这些句子并不是随便写的，而是来自真实的文章（比如CNN的新闻文章、BuzzFeed的网站内容），系统把同一段文字分配给多个学习者，采纳最合理的结果。

更妙的是，翻译的结果可以再卖给CNN、BuzzFeed赚钱！

很多人笑称：在Duolingo，大家一边学习，一边被“骗去打工”。

学习者得到免费学习，企业得到低成本翻译，这种双赢的模式虽然听起来很好听，但是不太适合扩展，像CNN、BuzzFeed这样的客户太少，从长期来看，这种“劳动变现”的故事很酷，但并不符合教育产品的核心。

2014年，Duolingo逐渐将盈利的重点转向广告、考试（Duolingo English Test）和后来的订阅服务（Duolingo Plus/Super）。

不过Duolingo那种游戏化学习的方式，得到了很好的保留：

每次学习都是一个“关卡”；
练习有经验值（XP）、连胜天数（streak）；
失败时会扣除“lives”，需要重新挑战；
用户可以和朋友竞争排名。

这种机制让学习语言变成了刷游戏，很多人本来只是随便试试，却被连续打卡的 streak 机制“套牢”。

有用户 streak 了 1000 多天，生怕断掉，于是出国时宁愿用漫游网络也要继续练习。

如果你注册了，但不学习，Duolingo的催促机制也非常诙谐幽默，有网友晒 streak 破千的截图，评论区全是“我不敢停，怕猫头鹰半夜来我家”。

每次我看到Duolingo发的邮件，都会忍不住会心一笑，点开链接，再去学一会儿。

2013 年，苹果公司将 Duolingo 评选为年度 iPhone 应用，这是教育类应用的首例。

2014年，Duolingo Crunchies 大赛中荣获最佳教育初创公司奖，并且是 2013 年和 2014 年 Google Play 中下载次数最多的“教育应用”。

2018,2019年入选CNBC“50大颠覆者”榜单。

2020 年 7 月，《个人电脑杂志》将其评为“最佳免费语言学习应用”

如今，Duolingo支持43种语言的课程和认证，从热门的语言（英语，法语，德语）到濒临灭绝的语言（夏威夷语，纳瓦霍语等）都有覆盖，甚至还有《权力的游戏》中的高等瓦雷利亚语（High Valyrian）和《星际迷航》中的克林贡语（Klingon）！

Duolingo 的用户群体，也超出了创始人最初的预期，从发展中国家的低收入群体，到中学大学的学生，甚至在欧洲难民潮期间，很多叙利亚难民用 Duolingo 免费学习德语和英语，以便融入新的环境。Duolingo 因此被 NGO、联合国等机构推荐。

路易斯说：“我们最自豪的不是市值，而是有数以百万计的人因为 Duolingo 改变了人生轨迹。”

总结

从标记图片，到验证码，再到学习语言，路易斯这三次“欺骗”都获得了巨大的成功。

而这一切背后的的核心思想，就是路易斯的博士论文《Human computation》：把一些计算机难以完成，但人类很擅长的任务，通过某种方式分配给人来做，然后把结果汇总起来，就好像是人类在“充当计算机的一部分”。

用这种方式，把每个人微不足道的碎片时间和好奇心利用起来，汇集成不可阻挡的洪流。

这就是最了不起的骗局，它不仅没有伤害，反而形成了推动世界进步的力量。