14、囚犯训练人工智能:数据劳动中的幽灵、人类与价值

囚犯训练人工智能:数据劳动中的幽灵、人类与价值

1. 引言

当走进芬兰初创公司 Vainu 的开放式办公室,墙上大屏幕展示的图表映入眼帘。公司代表介绍,这是关于按需数据劳动者的统计信息,他们通过浏览文本数据、标注组织等命名实体的词汇,为 Vainu 生成训练数据,以此训练其人工智能(AI)。Vainu 从公共资源获取数据,利用机器学习模型将非结构化数据转化为结构化数据,当模型遇到无法识别的内容时,会通过应用程序编程接口(APIs)从亚马逊土耳其机器人(MTurk)等按需平台自动查询更多训练数据。

数据劳动这一领域的研究正在迅速扩展,涉及自动化和数字平台等诸多问题。在自动化决策(ADM)相关研究中,人类参与往往被忽视,部分原因是 AI 供应商有意掩盖人类为其服务创建和训练所付出的努力。然而,在数据转化为可用资源的过程中,人类劳动至关重要,如数据清理、编辑、生成元数据和添加上下文信息等工作。

本文以芬兰囚犯为当地 AI 公司标注芬兰语数据的劳动安排为例,探讨“自动化的隐藏面”——数据劳动。这种数据劳动被称为“幽灵工作”,因其不为人知且易被忽视。芬兰监狱作为数据劳动的特殊场所,引发了关于低技术工人在数字匮乏环境中从事高科技工作的思考。

2. 数据劳动引入监狱

2019 年 3 月,Vainu 宣布 AI 进入芬兰监狱,囚犯参与芬兰语 AI 开发。这一不寻常的合作由 Vainu 创始人之一 Tuomas Rasila 发起,并受到国际媒体关注。有文章质疑监狱数据劳动是赋能还是剥削,但未明确表态,指出监狱劳动的本地背景存在差异。

Rasila 积极看待这一项目,他认为监狱里的人有大量时间,且监狱的数字落后状况需要技术创新。在他看来,将最先进的 AI 与处于社会边缘的囚犯相结合,能让原本不受欢迎的低技能劳动力参与高端发展。

Vainu 需要处理需要特定地域或文化解读的数据,如判断芬兰语文本中的命名实体是市政当局、公司还是手机等。常规平台如 MTurk 无法提供足够具备必要本地技能的劳动力,自动翻译又会产生大量错误和误解。此前 Vainu 让实习生生成芬兰语训练数据,也考虑过通过人力资源机构雇佣数据劳动者或使用 UpWork 等平台,但这些方法都无法满足机器学习系统的数据需求。Vainu 需要大量稳定的劳动力及时生成适量的训练数据,数据劳动的灵活性和按需性质对其尤为重要。

芬兰刑事制裁局(RISE)官员看好这一项目。由于监狱在与全球南方廉价劳动力的竞争中失去优势,监狱与公司的合作逐渐减少,因此新的监狱工作机会颇具吸引力。于是,在芬兰的两所封闭监狱(赫尔辛基和图尔库各一所)开展了为期 15 个月的试点项目,数据劳动首先在三个封闭监狱病房引入。

囚犯使用定制笔记本电脑和专用软件,通过不同颜色标注不同类型的命名实体,为 AI 训练生成元数据。Vainu 对提供的电脑和软件进行了安全审计,囚犯在监狱官员的监督下工作,工作空间较为灵活,后期甚至可在牢房进行。Vainu 代表对囚犯的工作质量感到惊喜,认为其高于 MTurk 上的工作质量。公司强调只关注 AI 训练的最终注释数据,对监狱内部的安排不了解也不感兴趣。

总体而言,Rasila 认为监狱数据劳动试点是一个概念验证,表明 Vainu 可以让任何愿意从事数据劳动的人工作,并自动审核结果质量。他和同事曾设想建立一个更通用的平台,将数据劳动任务分配到人们有空闲时间的地方,但这不符合 Vainu 的商业利益。不过,这证明了如果数据劳动能在监狱进行,那么在任何地方都可以。在这方面,监狱成为了自动化进程的加速器和技术开发的试验场。

3. 监狱数据劳动的价值

从全球和历史角度看,监狱劳动通常具有惩罚性质,可能是生产性劳动、无意义的繁重工作或满足间接制度需求。监狱数据劳动有可能被视为另一种惩罚形式,且数字生产可能存在其他剥削潜力。然而,在芬兰刑罚体系中,监狱数据劳动旨在增强囚犯的能动性,缓解不平等,对监狱系统而言是一个有价值的项目。

芬兰奉行“理性和人道的刑事政策”,其刑罚政策注重人权,囚犯权利与其他公民一样受到保护。社会和刑事政策相互交织,福利措施既用于应对社会边缘化和不平等,也用于预防犯罪。芬兰的监禁率远低于国际标准,2019 年每 10 万居民中仅有 50 名囚犯,约为欧洲中位数的一半、澳大利亚的四分之一、美国的七分之一。

数据劳动试点在封闭监狱病房进行,被关押在封闭监狱的囚犯要么是惯犯,要么犯有极其严重的罪行。芬兰刑法旨在维护封闭机构内人员的健康和功能能力,将剥夺自由视为惩罚本身,不允许施加额外的困难。监禁的目的是提高罪犯重新融入社会、过上无犯罪生活的能力,“正常化原则”要求监狱条件尽可能接近外界生活条件。

虽然芬兰监狱也存在严酷和绝望的一面,但基于芬兰的刑罚理念,监狱劳动中有助于囚犯最终重新安置的方面会得到认真考虑。在这种背景下,监狱数据劳动有助于囚犯回归平民生活。

在试点项目中,Vainu 向 RISE 支付数据劳动费用,定价方式与 MTurk 等幽灵工作平台类似,按任务支付,市场点击工作任务的中位数时薪为 2 美元。Vainu 在 MTurk 上为任务支付的报酬并非最低,但在芬兰仍属极低水平。RISE 为 Vainu 定义的每项任务价格,是根据囚犯在特定时间内预计完成的任务数量估算的。囚犯并非按任务获得报酬,而是获得适度的津贴,并非真正意义上的工资。封闭病房的囚犯需参与自由选择的“监狱活动”,包括劳动、课程、培训和康复项目。数据劳动提供的每日津贴略高,为 4.62 欧元,这使得囚犯选择数据劳动更有益。通常,囚犯每天工作时间不超过几小时,Vainu 的数据劳动也是如此。

监狱数据劳动的经济价值凸显了该案例的本地根源。芬兰监狱数据劳动在国际上具有独特性,它基于当地监狱劳动历史,也与自动化的大趋势相呼应,特别是对大量廉价数据劳动者的需求。监狱似乎是一个有前景的扩展领域,与北欧其他文化或语言特定数据劳动的替代方案相比成本较低,且尚未受到竞争对手的触及。然而,数据劳动形式也可能存在危害,如内容审核涉及评估暴力和仇恨内容,会对劳动者造成心理伤害。芬兰监狱当局会从囚犯安全、社会后果和工作所体现的道德价值观等方面考虑监狱数据劳动的适用性。在 Vainu 的数据劳动中,囚犯处理的新闻文章等材料被认为无害,工作工具(计算机)也不会造成明显的身体伤害,被训练的 AI 最终用于更高效的销售运营,也被认为是可接受的。

4. 充满期望的数据劳动

外界可能认为数据标注简单乏味,但监狱官员认为阅读和注释工作具有认知挑战性,比囚犯可选择的其他工作更有价值。RISE 的线人强调,许多封闭监狱病房的囚犯存在学习困难,学习自尊较低。数据劳动需要阅读和解释文本等技能,为封闭监狱环境引入了知识导向的工作。与典型的监狱劳动(如把螺丝放进盒子里)不同,数据劳动要求囚犯更加积极思考,因为工作涉及解决问题和密切关注细节。

在监狱环境中,数据劳动被视为一个充满期望的场所,它有助于囚犯融入知识社会,发展和保持他们的能力。Rasila 认为数据劳动能激发囚犯的内在动力,当囚犯知道自己的工作对他人有用时,会获得成就感。例如,完成一项任务后,AI 会得到改进,永久节省人力。

监狱数据劳动的期望体现在选择非典型监狱病房开展项目上。RISE 首先在一所男性监狱的女性病房引入数据劳动,认为女性囚犯可以为 AI 做出有价值的贡献。此外,青少年囚犯和单独监禁的囚犯(如性犯罪者)也被认为适合参与。传统监狱劳动需要专门的车间空间且以小组形式进行,某些囚犯群体无法参与,而数据劳动的灵活性和独立性使这些囚犯受益。因此,数据劳动被视为一种有前途的康复工作,理论上在封闭病房甚至单独牢房都可以安全进行。

试点项目的推动者希望通过训练 AI,让囚犯在日益数字化的就业市场和社会中获得自信。然而,监狱在很大程度上仍是数字匮乏的环境,囚犯对计算机和信息网络的访问极其受限。在监狱中,计算机被视为可疑物品,但根据芬兰刑法的“正常化原则”,监狱不能成为数字孤岛。芬兰监狱当局计划为牢房配备计算机终端,用于电子服务和通信,而基于这些终端的计算机化监狱劳动符合促进囚犯数字融入的趋势。

有一个例子体现了监狱数据劳动的好处。一名来自芬兰边缘少数民族的女性囚犯,此前没有使用计算机的经验。在尝试数据劳动后,她喜欢阅读系统提供的新闻文章,对计算机也更加熟悉。她很高兴能说自己在服刑期间参与了 AI 创建,这比叠袜子或包装螺丝听起来更有意义。

对于 Brooke Erin Duffy 而言,期望劳动是指数字环境中的生产活动,参与者相信这些活动将在未来带来物质回报、社会和经济资本或职业机会。监狱数据劳动也有类似特点,工作被认为从长远来看对囚犯有益,有助于他们最终重新安置。但与 Duffy 所描述的数字内容创作者不同,监狱数据劳动的未来回报不一定是囚犯自身的期望,更多是基于专业评估的他人对囚犯的康复期望,即让囚犯在数字化社会中有更好的机会成为有功能的参与者。当期望不在于工作本身的未来回报,而在于其为囚犯康复和重新融入社会提供的机会时,AI 训练这种廉价、碎片化且缺乏职业发展前景的劳动形式的缺点就显得不那么重要了。

5. 人类,而非幽灵

数据劳动项目初期,Vainu 和监狱管理部门都对结果表示满意,并计划扩大项目范围,培训新监狱的工人担任监督员。然而,就在获得进入监狱进行研究的许可后,COVID - 19 疫情导致监狱关闭,禁止所有访客进入。2020 年夏天,当限制即将解除时,Vainu 意外决定终止项目,新管理团队认为该项目不属于核心业务。

参与项目的人员难以接受这个决定,他们认为该项目在很多方面是双赢的,既支持了监狱系统的目标,又满足了公司对廉价劳动力的需求。项目的突然终止凸显了私营企业在塑造 ADM 未来时的短视利益。虽然公司热衷于在公共部门资源的支持下启动新计划,但他们的承诺往往不确定,行动也缺乏问责。大多数公司在自动化的潜在未来方面缺乏想象力,往往随波逐流。

尽管监狱数据劳动试点项目短暂结束,未能明确证明其价值,但它在短时间内展示了不同期望和价值目标的大胆结合。公私合作成功地协调了合作方可能相互冲突的目标,因此被描述为双赢项目。如果有合适的合作,该试点本可以扩展为一个更通用的数据劳动平台,满足更多数据需求。

与常规幽灵工作平台(如 MTurk)不同,Vainu 的监狱数据劳动安排有其独特之处。MTurk 作为中介,为机器提供获取人类数据劳动的途径,并将数据劳动者与任务匹配。Vainu 构建的数据劳动管道也起到了中介作用,但不同的是,Vainu 确保了任务在机器和人类之间的传输,而监狱及其工作人员确保了囚犯能够参与任务。幽灵工作平台通常隐藏数据劳动者,而在监狱中,囚犯对监狱官员和顾问是可见的,他们会考虑数据劳动对囚犯的适用性和康复潜力。在监狱中,人机匹配会考虑监狱系统与囚犯相关的价值目标,从而建立新的关怀关系。这表明囚犯不是幽灵,而是生活条件有待改善的真实个体。

监狱数据劳动案例强调,ADM 的任何安排都依赖于当地和具体的关系和变化。我们需要仔细考虑这些方面,以免忽视重要差异,只看到技术决定论的未来。即使数据劳动可能被认为缺乏吸引力、具有剥削性甚至有辱人格,但当目标是改善数字化社会边缘人群的生活时,这些问题就会被置于次要地位。芬兰囚犯的 AI 训练不仅植根于现有的不平等,还试图与之合作,提醒我们过去、现在和未来如何同时影响 ADM 领域。更重要的是,该案例凸显了人类在将数据转化为可利用资源过程中的关键作用,人类的参与和想象对于推动自动化未来至关重要。人类及其指导价值观是人机安排中最关键的组成部分。

相关流程表格

步骤 描述
数据获取 Vainu 从公共资源(财务报表、商业新闻文章、社交媒体和网站内容)获取非结构化数据
模型处理 机器学习模型自动将非结构化数据转化为结构化数据
问题识别 当模型遇到无法识别的内容时,触发数据需求
数据查询 通过 APIs 从按需平台(如 MTurk)或监狱囚犯自动查询更多训练数据
数据标注 囚犯或按需平台劳动者标注数据,生成元数据
质量审核 Vainu 自动审核数据标注质量
AI 训练 使用标注后的数据训练 AI

mermaid 流程图

graph LR
    A[获取公共数据] --> B[机器学习模型处理]
    B --> C{是否遇到无法识别内容}
    C -- 是 --> D[通过 APIs 查询数据]
    C -- 否 --> B
    D --> E{数据来源}
    E -- 按需平台 --> F[按需平台劳动者标注]
    E -- 监狱囚犯 --> G[囚犯标注]
    F --> H[质量审核]
    G --> H
    H --> I[AI 训练]

不同地区监禁率对比表格

地区 监禁率(每 10 万居民中的囚犯数量)
芬兰 50
欧洲中位数 约 100
澳大利亚 约 200
美国 约 700

6. 监狱数据劳动的多面剖析

6.1 劳动性质的双重性

监狱数据劳动呈现出明显的双重性质。一方面,从传统视角看,它与常见的监狱劳动一样,具有一定的约束性和规范性。囚犯处于监狱的管理体系之下,工作需要遵循监狱的相关规定和安排,例如在规定的时间和空间内完成任务,接受监狱官员的监督等。另一方面,它又区别于典型的体力型监狱劳动,具有知识和技能导向性。数据标注工作要求囚犯具备一定的阅读、理解和分析能力,这为囚犯提供了接触新知识和技能的机会,有助于提升他们的认知水平。

6.2 价值创造的多元性

  • 对公司的价值 :对于 Vainu 公司而言,监狱数据劳动解决了数据获取的难题。在处理特定地域和文化相关的数据时,监狱囚犯提供了稳定且高质量的劳动力。这使得公司能够获得准确的训练数据,提高 AI 系统的性能,进而提升其在市场上的竞争力,为公司的业务发展带来积极影响。
  • 对监狱系统的价值 :从监狱系统的角度来看,数据劳动有助于实现其改造囚犯的目标。通过参与数据劳动,囚犯能够培养责任感和工作技能,增强自信心,为回归社会做好准备。同时,这也为监狱管理带来了新的思路和模式,促进了监狱与外界的合作与交流。
  • 对囚犯个人的价值 :对于囚犯个人来说,数据劳动具有多方面的益处。首先,经济上的津贴虽然不多,但为他们提供了一定的物质支持。更重要的是,在精神层面上,数据劳动让他们感受到自己的价值,增强了自我认同感。参与到高科技的 AI 训练项目中,使他们能够接触到外界的信息和技术,拓宽了视野,为未来的职业发展奠定了基础。

6.3 潜在风险与挑战

  • 数据安全风险 :尽管 Vainu 对提供的电脑和软件进行了安全审计,但监狱环境的特殊性仍然存在数据安全隐患。囚犯可能会利用工作机会获取或传播敏感信息,或者对数据进行恶意篡改,这对公司的数据安全构成威胁。
  • 囚犯心理压力 :数据劳动虽然被认为具有认知挑战性和价值,但对于一些学习能力较弱或心理承受能力较差的囚犯来说,可能会带来较大的心理压力。长时间面对电脑和复杂的文本数据,可能会导致他们产生焦虑和疲劳情绪,影响身心健康。
  • 社会观念的偏见 :社会上可能存在对监狱数据劳动的误解和偏见,认为这是一种剥削囚犯的行为。这种观念可能会给项目的推广和持续发展带来阻力,也会影响囚犯参与劳动的积极性和自信心。

7. 未来展望与启示

7.1 项目的可持续发展

  • 拓展合作模式 :可以考虑进一步拓展监狱与公司的合作模式,不仅仅局限于数据标注工作。例如,可以开展更多与信息技术相关的培训和项目,让囚犯能够学习到更全面的技能,提高他们在数字领域的就业竞争力。
  • 建立长期机制 :为了确保项目的可持续发展,需要建立长期稳定的合作机制。包括明确双方的权利和义务,制定合理的薪酬体系和激励机制,保障囚犯的合法权益,同时也满足公司的业务需求。

7.2 对社会的启示

  • 重新审视监狱劳动 :监狱数据劳动的案例提醒我们,应该重新审视监狱劳动的意义和价值。监狱劳动不应仅仅被视为一种惩罚手段,而可以成为一种促进囚犯改造和社会融合的有效途径。通过提供有意义的工作机会,让囚犯在服刑期间能够获得技能和知识,为他们回归社会创造更好的条件。
  • 关注弱势群体的数字参与 :在数字化时代,弱势群体的数字参与问题日益凸显。监狱数据劳动为解决这一问题提供了一个有益的思路。我们应该关注那些处于社会边缘的人群,为他们提供更多接触数字技术和参与数字劳动的机会,缩小数字鸿沟,促进社会的公平与包容。

7.3 对自动化发展的思考

  • 人类与机器的协同 :该案例强调了人类在自动化过程中的重要作用。尽管 AI 技术不断发展,但在数据处理和训练的过程中,人类的参与仍然不可或缺。人类的知识、经验和判断力能够为 AI 系统提供更准确的输入,实现人类与机器的协同发展。
  • 价值导向的自动化 :在推动自动化发展的过程中,我们应该更加注重价值导向。不仅仅追求技术的进步和效率的提升,还要考虑自动化对社会、人类和环境的影响。以监狱数据劳动为例,通过将社会价值和经济价值相结合,实现了自动化发展的多元化目标。

不同利益相关方的期望与收获表格

利益相关方 期望 收获
Vainu 公司 获取稳定、高质量的特定语言和文化数据,提高 AI 性能 准确的训练数据,提升市场竞争力
监狱系统 帮助囚犯改造,提升其技能和社会适应能力 培养囚犯责任感和工作技能,促进监狱与外界交流
囚犯 获得经济收入,提升自我价值和技能 经济津贴,增强自信心和认知能力,接触外界信息

mermaid 流程图:项目可持续发展路径

graph LR
    A[拓展合作模式] --> B[开展多领域信息技术培训]
    A --> C[探索新的数据相关项目]
    D[建立长期机制] --> E[明确双方权利义务]
    D --> F[制定合理薪酬体系]
    D --> G[建立激励机制]
    B --> H[提升囚犯就业竞争力]
    C --> H
    E --> I[保障项目稳定运行]
    F --> I
    G --> I
    H --> J[促进囚犯社会融合]
    I --> J

综上所述,监狱数据劳动是一个具有创新性和启发性的案例。它展示了在自动化发展的背景下,如何通过跨领域的合作,为弱势群体提供机会,实现社会价值和经济价值的双赢。在未来的发展中,我们应该充分认识到人类在自动化过程中的核心地位,以价值为导向,推动自动化技术的健康、可持续发展。同时,要积极应对项目中可能出现的风险和挑战,不断完善合作机制,为更多的人创造参与数字劳动的机会,促进社会的公平与进步。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值