AI与人类协作新范式:增强智能而非替代智能

王者杯·14天创作挑战营·第8期 10w+人浏览 139人参与

目录

1 引言

2 相关工作综述

2.1 从“技术替代论”到“人机协作论”的研究演变

2.2 典型人机协作实证研究

2.3 行业与地域层面的人机协作与 AI 采用研究

3 基础知识与原理

3.1 人工智能与生成式 AI 的基本框架

3.2 人机协作与“协作智能”的理论根基

3.3 自动化潜力、生产率与宏观影响

4 AI 与人类协作的新范式框架

4.1 “增强智能而非替代智能”的核心理念

4.2 协作角色与任务划分:从“人用工具”到“人与 AI 团队”

4.3 协作范式在不同行业中的变体

5 典型应用场景与案例分析

5.1 知识工作与创意产业:从“空白页恐惧”到“人机共创”

5.2 软件开发与工程:AI 结对编程与自动化测试

5.3 客户服务与运营:人机双向学习的知识系统

5.4 公共部门与社会服务:从“自动批量处理”到“个性化增强”

6 协作系统的设计原则与技术实现

6.1 设计原则一:人类在环(Human-in-the-loop)与责任清晰

6.2 设计原则二:可解释性与可校准的信任

6.3 设计原则三:以人为中心的界面与流程嵌入

6.4 设计原则四:数据与模型治理

7 风险、伦理与治理框架

7.1 人机协作中的公平与偏差问题

7.2 可追责性与法律责任分配

7.3 环境与社会影响

8 未来研究方向与结语

8.1 未来研究的若干方向

8.2 结语:从“取代焦虑”走向“协作设计”

参考资料


1 引言

近十年来,人工智能尤其是深度学习和生成式模型的突破,使“机器会不会取代人类”重新成为公共舆论和学术界的焦点。然而,从大量企业实践和实证研究来看,更贴近现实的图景并不是“完全替代”,而是一种人类与AI深度协作的“增强智能”新范式:机器在大规模感知、记忆和模式识别方面近乎无穷,人类在价值判断、责任承担、跨情境迁移和社会沟通方面仍然不可替代,两者的结合正在重塑生产、服务、科研乃至政府治理的方式。

从宏观层面看,AI 正在快速从“试验性部署”走向“规模化应用”。基于欧盟和经合组织最新统计,2024 年欧盟 27 国中,拥有 10 名及以上员工的企业中约有 13.5% 已经采用至少一种 AI 技术,比 2023 年的 8% 有显著提升,属于一年内的跳跃式增长;在北欧国家,这一比例更是超过 25%,而一些中东欧国家尚不足 6%,呈现出明显的区域分化。(OECD)荷兰统计局发布的 AI 监测结果也显示,2024 年荷兰有 22.7% 的企业在业务中使用一种或多种 AI 技术,比上一年提高了近 9 个百分点。(Centraal Bureau voor de Statistiek)在经合组织与欧盟联合的 ICT 调查中,加拿大、英国、美国等国的官方统计同样证实了这种“后 ChatGPT 时代”的加速扩散——例如加拿大 2024 年一季度已有 9.3% 的企业在使用生成式 AI,第四季度使用 AI 生产商品或服务的企业比例达到 10% 以上;美国 2025 年春季则有 8.3% 的企业报告已在生产环节中使用 AI,并且另有约 10.9% 计划在 6 个月内采用。(OECD)

这一扩散并非简单的“自动化替岗”,而是显著改变了工作形态与协作方式。麦肯锡全球研究院在对 47 个国家、2100 多项工作活动进行重新评估后指出,随着生成式 AI 加入工具箱,理论上可被现有技术自动化的劳动时间占比从此前估计的约 50% 提升到 60%–70%;如果这些技术被广泛采纳并配合劳动力结构调整,2030–2040 年间全球劳动生产率每年的增速中,自动化和 AI 可能贡献 0.5–3.4 个百分点,其中仅生成式 AI 就可贡献 0.1–0.6 个百分点。(McKinsey & Company)然而他们同时强调,这种潜力只有在“人类被重新配置到更高价值活动上”、“组织流程实现深度重构”的前提下才能兑现,换言之,关键不在“用 AI 替掉谁”,而在“如何让人和 AI 协同产生更高价值”。

更微观的实验和企业数据,则为“增强智能”提供了扎实的经验证据。MIT 学者 Noy 与 Zhang 在一项针对 453 名受过大学教育的专业人士的写作实验中发现,获得 ChatGPT 辅助的一组,在完成职业写作任务时平均用时减少约 40%,作品质量评分提高约 18%,且低能力组的提升幅度尤其明显,生产率分布被显著“压缩”。(papers.ssrn.com)GitHub 与研究者合作的 Copilot 实验显示,使用 AI 结对编程工具的开发者在实现同一 HTTP 服务器任务时,比对照组快 55.8%,而代码质量并未下降。(arXiv)斯坦福与 MIT 的研究团队在一家大型呼叫中心部署生成式对话助手,则观察到座席单位时间解决问题数平均提升 14%,对新手和低技能员工的提升更高达约 34%。(NBER)

这些结果共同描绘出一个清晰的趋势:AI 不仅没有简单地“消灭工作”,反而在大量知识密集型场景中显著提升了个体生产率,尤其是帮助低经验/低技能群体向高水平靠拢。这种“协作型增益”在公共部门同样可见——2024 年一项对英国 938 名公共服务人员的调查显示,22% 的受访者已经在工作中主动使用生成式 AI,约 61% 对其输出持高度信任,他们普遍认为,如果在国家医疗体系中合理利用生成式 AI,医护人员在行政文书上的时间占比有望从 50% 降至 30%。(arXiv)

为了更直观地展示这一“协作式扩散”趋势,我们先给出一张基于官方与权威统计的全球企业 AI 采用概览表。

表1 全球企业采用 AI 的部分统计(2023–2025,选取地区)

地区/国家年份指标说明数值
欧盟 27 国整体202310 人及以上企业中,至少采用一种 AI 技术的比例8% (newmediasoft.de)
欧盟 27 国整体202410 人及以上企业采用 AI 的比例13.5% (OECD)
丹麦2024企业使用 AI 技术的比例27.6% (CBI)
瑞典2024企业使用 AI 技术的比例25.1% (CBI)
比利时2024企业使用 AI 技术的比例24.7% (Notes From Poland)
荷兰202410 人及以上企业使用一种或多种 AI 技术22.7% (Centraal Bureau voor de Statistiek)
罗马尼亚2024企业使用 AI 技术的比例3.1% (Notes From Poland)
波兰2024企业使用 AI 技术的比例5.9% (Notes From Poland)
保加利亚2024企业使用 AI 技术的比例6.5% (Notes From Poland)
加拿大2024Q1已使用生成式 AI 的企业比例9.3% (OECD)
加拿大2024Q3用 AI 生产商品或提供服务的企业比例10.6% (OECD)
美国2025用 AI 生产商品或服务的企业比例8.3% (OECD)

这张表背后的故事是:AI 采用正在迅速从“早期试验者”向更大范围扩散,却又呈现明显的不均衡;而这种扩散的方式越来越体现为“人机协作”而非“人类退出”。因此,系统性地理解和构建“AI 与人类协作新范式”,不仅是学术问题,更是产业和政策实践中的紧迫任务。本文将在综述现有工作和基础理论的基础上,提出一个以“增强智能”为核心的协作框架,并通过多领域案例说明其设计原则、技术实现路径和治理要求。

2 相关工作综述

2.1 从“技术替代论”到“人机协作论”的研究演变

早期关于自动化与就业的研究大多建立在“技术替代”框架之上:技术通过替代特定任务中的人类劳动,从而减少对某些岗位的需求,进而影响工资与就业结构。这一传统可以追溯到 Autor、Acemoglu 等关于“例行任务自动化”与“技能偏向性技术变革”的经典文献。在这些模型中,机器被视为一种“资本”,其功能主要是接管可明确定义、可编程的流程性任务。

然而,随着机器学习特别是生成式模型的出现,AI 能够参与的不再只是“明确规则的重复任务”,而是包括文本撰写、代码生成、客服对话、甚至辅助创意工作在内的大量“原本被视为高度认知、非例行的任务”。这使得传统“只替代低技能劳动”的直觉受到挑战。麦肯锡 2023 年的最新评估就指出,生成式 AI 显著提高了“应用专业知识”“管理和发展人才”等原本对自动化不敏感活动的技术自动化潜力:前者的可自动化比例上升了 34 个百分点,后者从 2017 年估计的 16% 上升至 49%。(McKinsey & Company)

与之相对应,近年的许多研究开始强调“人机互补”甚至“协作优势”。Wilson 与 Daugherty 在《哈佛商业评论》中提出“协作智能(Collaborative Intelligence)”概念,基于对 1500 家企业的调研指出:性能改善最大的往往不是“全自动”场景,而是让机器与人类各自发挥优势、相互增强的协作流程,例如 AI 负责大规模数据处理与模式发现,人类负责设定目标、解释结果并对 AI 的输出进行监督与创造性利用。(哈佛商业评论)

在人机协作的形式上,Davenport 等人则从企业实践出发,提出了“自动化型”“增强型”“创新型”三类 AI 使用模式,分别对应于替代、赋能和共创三种不同逻辑,并指出后两者对于真正释放 AI 潜力至关重要。(Leading360)这些理论工作共同推动了研究重心从“AI 会替代多少工作”转向“用户、组织和制度如何重构,以便与 AI 合作得更好”。

2.2 典型人机协作实证研究

真正推动“协作新范式”从概念走向可信议程的,是近两年涌现的一系列随机对照实验与自然实验,它们在真实或准真实的工作环境中量化了 AI 辅助对人类表现的影响。为了方便后文分析,我们将部分具有代表性的结果汇总于表 2。

表2 典型人机协作实证研究中的生产率与表现变化

研究场景与任务关键指标人机协作效果
Noy & Zhang (2023)(papers.ssrn.com)453 名大学学历专业人士完成中等难度的职业写作任务,一半可使用 ChatGPT完成时间、作品质量评分使用 ChatGPT 组平均用时减少约 40%,输出质量评分提升约 18%,且低基线能力参与者的提升幅度最大,生产率差距被显著压缩
Peng et al. (2023) – GitHub Copilot(arXiv)受邀开发者以 JavaScript 实现 HTTP 服务器,实验组可使用 Copilot完成任务所用时间使用 Copilot 的开发者平均完成时间比对照组快 55.8%,代码质量无显著下降
Brynjolfsson et al. (2023) – Generative AI at Work(NBER)5179 名客服座席,分批获得生成式 AI 对话助理每小时解决问题数、客户满意度、新手表现使用 AI 助手后,平均生产率(每小时解决问题数)提升约 14%,新手与低技能组提升约 34%,客户情绪评分改善、离职率下降
Bright et al. (2024) – 英国公共部门(arXiv)938 名公共服务人员调查,涵盖 NHS、教育、社工等使用率、主观效率预期45% 受访者知晓所在领域已使用生成式 AI,22% 自己在用;NHS 相关受访者预期若充分利用 AI,行政文书时间占比可由 50% 降至 30%,相当于每周多出一天时间用于核心工作

从这些研究可以看到几个重要模式。第一,AI 辅助往往对“低经验/低技能”群体的边际收益更大:他们从 AI 的模式库和最佳实践中获益,使得表现向高水平收敛,这对缓解“数字鸿沟”和技能不平等具有潜在积极意义。第二,AI 的作用更多体现在“提高单位时间产出”而不是简单“减少岗位数量”,也就是说,它改变的是“每个岗位上人如何工作”,而非简单地让岗位消失。第三,成功案例几乎无一例外地强调“人仍在环中”(human-in-the-loop):无论是写作者、程序员还是客服,都没有把最终决策权完全交给模型,而是通过审阅、编辑与判断来保证输出可靠性。

2.3 行业与地域层面的人机协作与 AI 采用研究

在宏观层面,经合组织和欧盟统计局的最新报告表明,AI 采用在企业规模、产业、地区之间存在明显差异。2025 年的 OECD 报告指出,2024 年欧盟 27 国中,采用 AI 的企业比例从 2023 年的 8% 增至 13.5%,但北欧国家和高数字化经济体如丹麦、瑞典、芬兰等明显领先,而部分南欧和东欧国家则明显落后;此外,AI 的扩散更多由“领跑者继续领跑”驱动,领先国家与后进国家之间的差距在扩大。(OECD)在企业规模上,Eurostat 数据显示,大型企业的 AI 采用率往往是小企业的数倍,例如 2024 年欧盟整体中,大型企业中有约 41.2% 采用 AI,而中型企业为 20.9%、小企业仅 11.2%。(newmediasoft.de)

表3 欧盟企业按规模的 AI 采用情况(2024 年,基于 Eurostat 汇总)(newmediasoft.de)

企业规模(按员工数划分)指标说明数值
小型企业(10–49 人)至少采用一种 AI 技术的企业占比约 11.2%
中型企业(50–249 人)至少采用一种 AI 技术的企业占比约 20.9%
大型企业(250 人及以上)至少采用一种 AI 技术的企业占比约 41.2%
所有规模企业平均至少采用一种 AI 技术的企业占比13.5%

在美国,基于美国人口普查局商业趋势与展望调查(BTOS)的研究发现,2025 年约有 7% 左右的企业在生产或服务中使用 AI,但有显著比例计划在未来 6 个月内采用,呈现一种“静悄悄的 AI 革命”。(arXiv)英国则从官方调查中估计,2023 年只有约 9% 的企业采用 AI,但预计 2024 年这一比例将升至 22%,而按就业人数加权的“采用覆盖率”有望从 12% 增至 37%。(OECD)

这些宏观研究为“协作新范式”提供了外部环境约束:一方面,AI 采用仍然处于相对早期,大多数企业——尤其是中小企业——尚停留在试验或观望阶段;另一方面,领跑者在用 AI 重构流程、提升生产率方面已经获得先发优势,从而可能拉大地区和企业间的生产率差距。这意味着,如果我们期待“增强智能”成为普遍的工作范式,就必须特别关注协作系统在中小机构、公共部门以及教育体系中的可达性和可用性问题。

3 基础知识与原理

3.1 人工智能与生成式 AI 的基本框架

从技术层面看,当前驱动“增强智能”的核心并不是单一算法,而是一整套以大规模数据、算力和模型为基础的技术栈。传统机器学习通过构建针对特定任务的模型(如分类、回归、推荐等),学习输入与输出之间的映射,其优势在于在狭窄任务上达到乃至超越人类水平;深度学习则通过多层神经网络自动学习特征表示,极大地减少了特征工程负担,使视觉、语音、自然语言处理等领域获得了质的飞跃。

生成式 AI,尤其是基于 Transformer 架构的大规模预训练语言模型(LLM),在此基础上进一步引入了“自监督预训练+指令微调”的范式。模型先在海量文本上学习语言的统计结构,再在指令-回答数据上对齐人类偏好,从而具备了广义语言理解与生成能力。其重要之处在于:一方面,它可以作为“通用接口”,通过自然语言与人沟通,并跨任务迁移;另一方面,它可以作为“协作中枢”,把搜索、检索、函数调用、工具调用等能力统一在一个对话式框架中,实现从信息获取、方案生成到执行落地的端到端协作。

在这一框架下,传统的人机分工边界被模糊了:许多原本需要专业技能的小任务(如撰写邮件、起草报告、生成代码片段)可以被“通用模型+轻量工具”组合实现;同时,模型的输出质量和可靠性又强烈依赖于人类提供的上下文、约束和评估机制。这正是构建“增强智能”系统的技术基础:我们不是为某个固定流程开发一套僵硬的自动化,而是为人类提供一个可编程、可对话的“第二大脑”和“超级合作者”。

3.2 人机协作与“协作智能”的理论根基

“协作智能”(Collaborative Intelligence)作为概念,早在群体智能和协同网络研究中就已出现,用来描述多主体系统(人或机器)通过协作产生超越个体的智能行为。(维基百科)在 AI 进入企业运营之后,这一概念被 Wilson 与 Daugherty 引入管理和组织语境中,用以强调“人类与 AI 团队”的重要性。他们通过对 1500 家公司的调研发现,业绩提升最大的企业往往采用三类互补模式:一是 AI 承担原本由人类完成的重复性任务,使人类有更多时间用于创造性和社交性活动;二是 AI 承担“认知放大器”角色,为人类提供更全面的数据分析和方案生成;三是人类对 AI 系统进行“训练、解释和治理”,担当“AI 训练师、解释师和维权者”等新角色。(哈佛商业评论)

从人机交互的视角看,Human-AI Interaction 领域近年的研究强调,随着 AI 从“被严格编程的工具”转变为“具有一定自主性的智能体”,人机关系从分工式、命令式逐渐演化为伙伴式、协作式,人类不再只是“告诉机器做什么”,而是与机器共同探索、共同学习。(维基百科)这要求我们在系统设计中显式考虑信任校准、角色分配、解释机制以及冲突解决机制,而这些恰恰是“增强智能”与传统自动化的关键差异所在。

3.3 自动化潜力、生产率与宏观影响

要理解“增强智能”对经济和社会的意义,我们需要把微观层面的协作收益与宏观层面的生产率和就业结构联系起来。麦肯锡的最新分析通过对 2100 多类工作活动的技术可自动化潜力进行评估,得出几个值得注意的结论:第一,在生成式 AI 出现之前,约有一半的劳动时间对应的活动在技术上可被自动化;在把生成式 AI 的自然语言能力纳入考量后,可自动化时间占比上升到 60%–70%。第二,达到“50% 劳动时间被自动化”的时间点,在基准情景中从此前估计的 2035–2070 年(中值约为 2053 年)提前到 2030–2060 年(中值约为 2045 年),加快了近 10 年。第三,若假设被自动化的劳动时间可以顺利重配置到其他活动上,自动化和 AI 从 2023–2040 年间每年可为全球劳动生产率带来 0.5–3.4 个百分点的额外增速,其中生成式 AI 贡献 0.1–0.6 个百分点。(McKinsey & Company)

表4 生成式 AI 对自动化潜力与生产率的宏观影响评估(麦肯锡 2023)(McKinsey & Company)

指标数值区间说明
技术上可自动化的劳动时间占比(2017 评估)≈50%基于当时自动化技术能力,对 2016 年工作活动的评估
技术上可自动化的劳动时间占比(加入生成式 AI 后)60%–70%将生成式 AI 的自然语言能力纳入后,对 2023 年工作活动的更新评估
达到 50% 时间被自动化的时间区间(旧估计)2035–2070 年,中值约 2053 年以 2017 年技术与 adoption 假设为基础
达到 50% 时间被自动化的时间区间(新估计)2030–2060 年,中值约 2045 年将生成式 AI 纳入后的 adoption 情景,整体提前约 10 年
自动化与 AI 对全球劳动生产率的年均贡献(2023–2040)0.5–3.4 个百分点在劳动力可顺利转岗的前提下,对生产率增速的额外贡献
其中生成式 AI 的年均贡献0.1–0.6 个百分点属于上述 0.5–3.4 个百分点区间的一部分

这里隐含着一个重要前提:上述“生产率红利”并不自动转化为“人人受益”。如果组织只是把自动化看作“节省人手”的手段,而没有在技能再培训、岗位设计和价值分配上做相应调整,那么 AI 的应用甚至可能加剧不平等与社会紧张。相反,如果把 AI 视为“增强智能”的基础设施,通过重构协作流程,让更多人利用 AI 放大自己的能力并参与更高价值创造,那么自动化潜力就有望转化为更广泛的福祉。

4 AI 与人类协作的新范式框架

4.1 “增强智能而非替代智能”的核心理念

“增强智能”并不是一句抽象的口号,而是一套关于人机角色分工与系统设计的具体主张。它的核心可以概括为三点:第一,机器主要承担“可形式化的模式识别与生成”,其优势在于规模、速度和一致性;第二,人类主要承担“目标设定、价值判断与责任承担”,其优势在于跨情境迁移、道德判断和社会协同;第三,协作系统的设计目标不是最大化“被自动化掉的岗位数量”,而是最大化“人机组合的综合产出”和“人类能力的可持续提升”。

从微观层面看,这意味着我们在设计 AI 系统时,需要刻意保留那些有助于人类学习与成长的环节,而不是一味追求“从端到端全自动”。例如在写作场景中,给用户提供“草稿+解释+修改建议”的组合输出,比直接给出“最终定稿”更有利于用户理解和掌控;在医疗影像诊断中,让医生看到 AI 的置信度分布和类似病例,而不是只看到一个“阳性/阴性”标签,有助于医生形成对系统优劣势的正确心智模型,从而在“AI 可能犯错的区域”保持特别警惕。

从宏观层面看,“增强智能”强调的是“人机共进化”:一方面,AI 通过为更多人提供“低门槛的高质量工具”,降低了参与高价值活动的技能门槛,有望缓解某些领域的“人才短缺”;另一方面,人类通过在使用中不断反馈与修正模型,使 AI 在更加丰富多样的情境中学习,从而形成新的能力。这种循环只有在广泛的人机协作基础上才可能发生。

4.2 协作角色与任务划分:从“人用工具”到“人与 AI 团队”

结合 Wilson 与 Daugherty 的协作智能研究以及 Human-AI Interaction 领域的综述,我们可以把典型的人机协作角色划分为几类互补角色,而不再把 AI 单纯视为“助手”或“替代者”。(哈佛商业评论)在一个成熟的协作系统中,人和 AI 之间至少可以形成以下几种结构性分工:

第一,AI 作为“探索者”和“草稿生成者”,负责快速生成多样化的备选方案、人类则作为“评审者”和“整合者”,在价值、风险、风格等维度做判断。例如在产品设计或文案创作中,AI 可以在几秒内给出多种风格的方案,人类再根据品牌策略和用户洞察选出和调整最合适的一版。

第二,AI 作为“监控者”和“预警系统”,在人类难以实时监控的复杂系统中持续运行,捕捉异常模式或潜在风险,而人类则对预警进行解释、确认并采取行动。这种模式在工业设备预测性维护、网络安全威胁检测等场景中已经较为普遍。(Evoke Technologies)

第三,人类作为“训练师、解释者和治理者”,在数据标注、反馈收集、模型评估和治理规则制定中扮演主导角色,而 AI 作为“被训练者”和“可控工具”,在这个过程中不断被驯化和校准。协作智能研究表明,那些在组织内设立专门的“AI 训练师/产品经理/伦理官”等角色的公司,更有可能将 AI 成功嵌入核心业务流程,而不是停留在零散试点。(哈佛商业评论)

4.3 协作范式在不同行业中的变体

不同产业的任务结构和责任边界差异很大,因此“增强智能”的协作范式也呈现出丰富的变体。在软件开发中,GitHub Copilot 这样的工具更多处于“代码自动补全+知识检索”的位置,开发者通过自然语言提示和代码片段快速获得候选实现,同时保留了对架构和质量的最终决策权;在这种模式下,生产率提升的主要来源是减少“样板代码”和“ API 查询”的时间。(arXiv)

在客户服务中,生成式 AI 辅助则更像是为每个新手配备一个“经验丰富的搭档”:Brynjolfsson 等人的呼叫中心研究表明,AI 助手之所以对新手提升显著,是因为它把高绩效座席的应答模式和知识库“蒸馏”出来,实时建议下一句话如何说、哪些知识点需要强调,新员工因此可以更快地接近老员工的表现。(NBER)这种模式本质上是一种“经验外化+知识共享”的协作智能,将原本随时间和流动而丢失的隐性知识结构化下来,通过 AI 在组织内部放大。

在公共部门,Bright 等人的调查数据则展示了另一种协作形态:生成式 AI 主要被用于减少行政文书和沟通成本,而不是替代一线服务。根据他们对英国公共服务专业人员的调查,45% 的受访者知晓所在领域有人在用生成式 AI,22% 本人正在使用,且 NHS 相关受访者普遍认为合理利用生成式 AI 可以把他们在文书与行政上的时间占比从 50% 降到 30%。(arXiv)

表5 英国公共部门生成式 AI 使用与态度调查要点(Bright et al., 2024)(arXiv)

指标数值说明
受访者样本量938 人来自英国教育、医疗、社工、应急服务等公共部门专业人员
知晓所在领域使用生成式 AI 的比例45%表示所在工作领域已有人使用生成式 AI
自己主动使用生成式 AI 的比例22%在日常工作中主动使用生成式 AI 工具
对生成式 AI 输出持较高信任的比例61%认为 AI 输出总体值得信任
担忧被生成式 AI 替代岗位的比例16%表示“非常担心”或“比较担心”自身岗位被替代
认为缺乏清晰使用指引的比例68%只有约 32% 认为所在单位有明确的生成式 AI 使用指南
NHS 相关受访者预期行政文书时间变化从 50% 降至 30%若合理引入生成式 AI,可将行政性工作时间占比降 20 个百分点

这张表既反映了生成式 AI 已经在一线工作中形成“去中心化的自下而上采用”,也暴露了“政策与治理滞后”的现实:大部分机构尚未给出明确的使用指南,员工在“非常好用”和“可能有风险”之间摇摆前行。这进一步说明,“增强智能新范式”的建设不仅是技术和产品问题,更是制度设计与组织治理问题。

5 典型应用场景与案例分析

5.1 知识工作与创意产业:从“空白页恐惧”到“人机共创”

在知识工作中,“空白页恐惧”是许多人经常经历的状态:面对一篇报告、一个方案或一段代码的起点时,最难的是“写下第一句”。生成式 AI 的优势恰恰在于,它几乎可以瞬间填满这张空白页:给出结构化大纲、提供多种开头备选、生成示例代码,甚至模拟不同读者的视角给出反馈。MIT 的写作实验已经证明,ChatGPT 不仅显著减少了完成写作任务所需时间,还通过提高最低能力组的表现,整体提升了作品的一致性。(papers.ssrn.com)

然而,如果只是让 AI“替我写完”,人类往往会丧失对文本的掌控感,甚至难以判断输出是否准确。因此,更符合“增强智能”理念的做法,是把 AI 嵌入到整个写作流程中:在构思阶段,使用 AI 帮助发散观点、补充背景知识;在起草阶段,让 AI 生成结构和部分段落,人类进行重写和个性化;在修改阶段,则用 AI 做风格统一、逻辑检查和事实核查的辅助。通过这种方式,AI 起到的是“思路放大器”而非“代笔者”的角色,最终作品的“所有权”和“责任”仍然清晰地落在人类身上。

在广告创意、游戏策划、影视分镜等领域,越来越多团队采用“人机共创工作坊”的形式:创意人员把故事线、受众画像、情绪基调等输入 AI,让其生成多种不同风格的脚本、画面描述或角色设定;随后,人类团队对这些素材进行筛选、拼接和再创作。这种工作模式既保留了“人类对文化与审美的把握”,又让团队能够在短时间内探索更大规模的创意空间。

5.2 软件开发与工程:AI 结对编程与自动化测试

软件工程是最早大规模引入 AI 协作的领域之一。GitHub Copilot 的实验结果已经表明,在 HTTP 服务器这样具有一定复杂度的任务上,使用 Copilot 的开发者完成时间比对照组快了 55.8%,而代码质量没有显著下降。(arXiv)许多企业在内部试点中也发现,AI 结对编程最直接的收益包括减少样板代码编写时间、降低查文档和搜索的频率、帮助新手快速熟悉代码库,以及在重构和测试生成中提供辅助。

从“增强智能”的视角看,关键在于如何设计合理的协作边界。比如,把 AI 主要用于“局部实现”和“接口建议”,而把系统架构、安全关键部分和性能优化保留在人类架构师和资深开发者手中;又比如,在 code review 流程中引入 AI 辅助检查潜在缺陷和安全问题,但最终是否接受合并仍由人工决策。许多团队还尝试让 AI 帮助生成单元测试和集成测试用例,从而在不额外增加人力的前提下提升覆盖率。

为了在企业级场景中真正落地,工程团队往往需要构建一整套“AI 协作工具链”,包括:基于内部代码库微调的私有模型或嵌入检索系统、与现有 IDE 和 CI/CD 流水线的深度集成、对 AI 生成代码的自动静态分析和安全扫描,以及用以追踪“AI 贡献度”的度量系统。只有在这些基础设施到位的情况下,AI 才能从“个人开发者的小帮手”成长为“团队级的协作成员”。

5.3 客户服务与运营:人机双向学习的知识系统

在前文提到的呼叫中心案例中,生成式 AI 不仅提升了生产率和客户满意度,也为构建“人机双向学习”的知识系统提供了样板。(NBER)在这一系统中,AI 并非孤立存在,而是与知识库、工单系统、CRM 等紧密集成:它从历史工单中学习问题类型与解决路径,在对话过程中实时推荐下一个可能问题和解决方案;同时,每一次人类座席的修改和补充,也会被系统记录下来,成为后续模型训练和知识库更新的素材。

这种“封闭回路”设计有几个关键要素。第一,明确的质量与反馈机制:座席需要有简单方式标注“AI 建议是否有帮助”,并可快速纠正错误答案;第二,分层权限与风险控制:针对高风险业务(如金融、医疗咨询),AI 的建议必须经过人类确认才能发送给用户;第三,持续的模型监控与偏差分析,以识别在哪些客户群体、问题类型或时间段,AI 的表现存在系统性偏差,从而针对性优化。

随着生成式多模态模型的发展,未来的人机协作还可以扩展到语音、图像和视频层面。例如,AI 可以实时分析用户语气中的情绪变化,辅助座席调整话术;在零售和物流领域,AI 可以结合摄像头画面和历史数据识别货架陈列问题或安全隐患,并由人类进行确认和处理。

5.4 公共部门与社会服务:从“自动批量处理”到“个性化增强”

公共部门的数字化传统上侧重于“流程线上化和批量处理”,而生成式 AI 的出现则提供了一个机会,把重心从“流程自动化”转向“个体能力增强”。英国公共部门的调查显示,许多一线工作者已经在非正式地使用生成式 AI 撰写邮件、重写报告、简化政策文书,甚至用它来帮助准备与民众沟通时的说明话术。(arXiv)

从增强智能的角度,公共部门可以采用“三层协作架构”:底层是符合数据保护和合规要求的安全模型和工具集;中间层是针对不同业务线(如社工评估报告、医疗病历摘要、教育个性化反馈)的专业模板和流程;顶层则是面向终端工作人员的简单接口,比如在现有办公系统中嵌入“AI 草稿”“ AI 校对”“ AI 解释法律条款”的按钮。通过这种架构,可以在不改变现有工作流程的基础上,为每个工作人员提供一个“随身小助手”,同时确保所有 AI 输出都通过合规和安全控制。

当然,公共部门在引入 AI 时还必须面对额外的公平与责任要求:例如,如何保证 AI 不会对弱势群体产生系统性歧视;如何确保 AI 的建议不会成为规避责任的借口;以及如何让公民理解并有机会对“算法如何参与决策”提出意见。这些问题将在后文专章讨论。

6 协作系统的设计原则与技术实现

6.1 设计原则一:人类在环(Human-in-the-loop)与责任清晰

无论 AI 能力多强,“增强智能”范式都要求在人机协作链路上保留清晰、可审计的人类责任节点。具体来说,在决策、执行和反馈三个阶段,都应至少有一个明确的“人类守门人”:

在决策阶段,人类负责设定目标和约束条件,选择哪些任务适合交给 AI、哪些需要人工主导,并明确 AI 的输出如何被使用(例如“仅供参考”“需要人工确认”“可自动执行”等不同级别)。在执行阶段,人类可以授权 AI 在低风险操作上自动执行(如格式化文档、生成代码草稿),但对涉及安全、财务、隐私和伦理的操作保留人工审批。

在反馈阶段,系统应为人类提供简便的方式对 AI 输出进行评价,并且将这些反馈真正用于模型的持续改进与治理,而不仅仅是“收集了数据却无处可去”。麦肯锡等机构的案例研究显示,那些建立了“人类反馈循环”和“模型治理委员会”的组织,更有可能在保证风险可控的同时,持续提升 AI 对业务的贡献度。(McKinsey & Company)

6.2 设计原则二:可解释性与可校准的信任

在协作场景中,信任既不能过低也不能过高:如果人类对 AI 的输出完全不信任,那么 AI 难以发挥实际作用;如果过度依赖,则可能在模型犯错时造成严重后果。Human-AI Interaction 的研究强调,系统应通过合适的解释机制帮助用户形成“校准良好”的信任。(维基百科)

这并不意味着要向普通用户展示复杂的内部参数或训练细节,而是提供与任务相匹配的“可操作解释”:例如在推荐系统中展示“为什么推荐这条内容”的几个关键因素;在诊断辅助中显示模型对不同可能诊断的置信度分布;在文本生成中标注“不确定片段”并建议用户重点检查。对于高度复杂的模型(如大规模语言模型)而言,完全透明可能不现实,但通过输出格式的设计、提示词工程和辅助工具,我们仍然可以显著提高用户对模型行为模式的理解。

6.3 设计原则三:以人为中心的界面与流程嵌入

“增强智能”强调的是让人类“更强”,而不是让系统“更复杂”。因此,协作系统的界面和流程设计应围绕人类的认知与工作流来展开,而不是让用户适应模型的工作方式。这在公共部门的调查中尤为明显:许多一线人员愿意使用生成式 AI 的前提是“它能嵌入我已经熟悉的工具和流程”,例如在电子病历系统或公文系统中添加一个“AI 建议”按钮,而不是要求他们切换到全新的平台。(arXiv)

具体做法包括:将 AI 能力封装为若干“原子能力”(如摘要、改写、翻译、检索增强问答),通过简单按钮或快捷键触达;在现有表单、知识库和工作流系统中嵌入 AI 建议栏,并且确保 AI 的输出是可编辑、可追溯的,而不是以“黑箱决策”的方式覆盖原有流程;为不同用户群体提供不同复杂度的界面,例如为开发者保留提示词和参数的细粒度控制,为普通业务人员提供模板化的任务入口。

6.4 设计原则四:数据与模型治理

协作智能系统离不开数据和模型,而数据与模型治理则是确保“增强智能”不会走向“失控风险”的基础。经合组织最新的 AI 采纳调查指出,缺乏相关技能、数据质量不足、对法律责任和合规性的不确定,是企业使用 AI 的主要障碍之一。(OECD)因此,一个成熟的协作系统应至少在以下几个方面建立规则:

第一,数据来源与用途的透明:清晰划分哪些数据可以用于模型训练,哪些只能用于推理;对敏感数据(如医疗记录、财务信息)制定去标识化和访问控制机制;对使用第三方模型时可能涉及的知识产权风险给予明确说明。

第二,模型生命周期管理:从模型选择、训练、评估到部署与退役,建立可审计流程;定期评估模型在不同群体、地区、时间段上的表现,识别潜在偏差;在发现重大问题时,能够快速回滚或切换模型。

第三,跨部门协作的治理结构:设立由业务、技术、法律、伦理等多方代表组成的“ AI 治理委员会”,定期审查重要协作系统的目标、效果和风险状况,为是否继续扩展应用范围或调整使用策略提供决策依据。

7 风险、伦理与治理框架

7.1 人机协作中的公平与偏差问题

在“增强智能”框架中,一个核心挑战是如何避免 AI 放大现有的不平等。因为模型的训练数据往往反映了现实世界中已经存在的偏见,一旦直接用来辅助决策,可能会在贷款审批、招聘、执法等敏感领域对某些群体造成系统性不利影响。即使在看似“中性”的场景,如客户服务或教育推荐中,如果模型对某些语言风格、地区口音或背景信息理解较差,也可能无意中让这些群体获得较差的服务体验。

从协作的角度,缓解偏差并非只靠“更好的模型”,而是要在系统设计中加入“反偏差的协作机制”:例如,让不同背景的员工参与标注和评估过程;在界面中给用户提供反馈渠道以报告可能的不公;在关键决策节点引入人为复核,并通过定期审计来检测模型在各子群体上的差异表现。经合组织的报告指出,许多企业已经把“公平和责任”视为采用 AI 的关键标准之一,但在具体方法论和工具方面仍有很大提升空间。(OECD)

7.2 可追责性与法律责任分配

在传统的信息系统中,责任分配相对清晰:系统只是工具,最终责任在操作人员和组织。然而,在高度自动化和协作智能系统中,当 AI 输出对现实产生重要影响时,“谁对结果负责”就不再简单。欧盟 AI 法案和各国正在制定的相关法规,普遍强调在人机协作系统中必须保留“可追责的自然人或法人”,并对高风险应用(如医疗诊断、关键基础设施控制)设定更高的透明与审计要求。

在实践中,组织可以通过几种方式降低责任不确定性:明确界定“ AI 建议”与“最终决策”的边界,并在系统日志中记录关键决策的人工确认过程;为员工提供关于 AI 使用的培训和指南,使其理解在何种情形下应当信任、怀疑或拒绝 AI 输出;对严重依赖 AI 的业务流程进行法律审视,确保合同、服务条款和隐私政策中对 AI 的角色有清晰说明。(OECD)

7.3 环境与社会影响

大型 AI 模型的训练与推理需要大量算力,进而消耗能源并产生碳排放。一项对自然语言处理模型能耗的研究估计,训练一个大型深度学习模型的碳排放可能达到数百吨二氧化碳当量。(McKinsey & Company)在“增强智能”范式下,虽然单次交互的能源消耗相对较小,但由于协作系统可能在大量工作岗位中持续运行,其环境影响不容忽视。

因此,在设计协作系统时,应综合考虑效率与可持续性:优先采用能效更高的模型和推理架构;在对延迟不敏感的任务上使用批处理和平衡负载;利用模型蒸馏和压缩技术减少模型规模;对高能耗应用场景进行碳足迹评估,并探索利用可再生能源的数据中心部署方案。

从社会层面看,自动化与增强智能可能导致部分岗位内容和技能需求发生深刻变化,这既是机会也是风险。协作智能范式的一个重要承诺,是通过“ AI 放大器”使更多人得以参与知识密集型工作,而不是把他们挤出劳动力市场。要实现这一点,教育体系和终身学习机制需要尽快调整,将“与 AI 协作的能力”纳入基础素养,例如 prompt 设计、结果评估、跨工具编排等。

8 未来研究方向与结语

8.1 未来研究的若干方向

尽管近两年关于人机协作的实证研究已经给出了令人鼓舞的结果,但“增强智能”作为一个系统性的范式仍处于早期阶段,仍有许多重要问题有待深入。

其一,需要更多跨任务、跨职业的人机协作大规模实验。目前的研究多集中在写作、编程和客服这些容易在线化、易度量的任务上,而在医疗、教育、制造等复杂环境中,协作的效果和风险模式可能完全不同。例如,在医疗影像诊断中,人机协作是否能稳定提高诊断准确率、减少漏诊?在人类教师与 AI 教学助手共同参与的课堂中,学生长期学习效果如何变化?这些都需要精心设计的随机对照实验与长期追踪研究。(麻省理工学院经济学)

其二,需要发展更加细致的“协作类型学”和“协作质量指标”。Nature Human Behaviour 上的一篇系统综述指出,人机组合的表现究竟优于还是劣于单一人类或单一 AI,往往取决于具体任务特性、协作模式设计以及反馈机制;因此,简单谈论“AI 会不会超过人类”意义有限,更重要的是理解“在什么任务、什么协作模式下,人机团队最优”。(维基百科)

其三,需要构建面向“协作智能”的教育与培训框架。现有的 AI 教育往往分为“工程师向”和“科普向”,而真正需要的是面向广大职场人士的“协作素养训练”:如何提出高质量问题、如何解读 AI 的不确定性和偏差、如何把 AI 嵌入流程并持续改进。这方面,公共部门和大型企业可以成为重要试验场。(arXiv)

8.2 结语:从“取代焦虑”走向“协作设计”

回顾本文,我们通过宏观数据、微观实证和理论分析,试图论证这样一个观点:在生成式 AI 迅速扩散的当下,“ AI 会不会取代人类”固然是一个重要问题,但更紧迫、更可操作的问题是“我们如何设计人与 AI 的协作方式,使其真正成为增强而不是削弱人类能力的力量”。

从欧盟和经合组织的调查可以看到,AI 的采用正在快速扩张但极不均衡,领跑者与落后者之间的差距在加大;从 Noy & Zhang、GitHub Copilot 和 Brynjolfsson 等人的研究可以看到,在精心设计的人机协作中,生成式 AI 能够显著提高生产率并缩小能力差距,尤其是帮助新手和低技能群体赶上高水平;从公共部门的调查可以看到,一线工作者已经在自下而上地使用 AI 减少行政负担、提升服务质量,但制度和治理尚未跟上。(OECD)

“增强智能而非替代智能”作为新范式,要求我们同时在技术、组织和制度三个层面做出改变:技术上,构建可解释、可治理、嵌入式的协作系统;组织上,重构角色分工与工作流,让人机各自发挥优势;制度上,完善公平、透明和可追责的治理框架,保障社会整体利益。在这一过程中,学术界、产业界与政策制定者需要形成一种新的“协作智能”:把彼此的知识和视角当作资源,而不是障碍。只有这样,我们才能真正让 AI 成为人类文明下一阶段的“放大器”,而不是新的焦虑来源。


参考资料

[1] Shakked Noy, Whitney Zhang. Experimental evidence on the productivity effects of generative artificial intelligence. Science, 381(6654):187–192, 2023. (PubMed)

[2] Sida Peng et al. The Impact of AI on Developer Productivity: Evidence from GitHub Copilot. arXiv:2302.06590, 2023. (arXiv)

[3] Erik Brynjolfsson, Danielle Li, Lindsey R. Raymond. Generative AI at Work. NBER Working Paper No. 31161, 2023. (NBER)

[4] Jonathan Bright et al. Generative AI is already widespread in the public sector. arXiv:2401.01291, 2024. (arXiv)

[5] McKinsey Global Institute. The economic potential of generative AI: The next productivity frontier. 2023. (McKinsey & Company)

[6] OECD. Emerging divides in the transition to artificial intelligence. OECD Publishing, 2025. (OECD)

[7] OECD/BCG/INSEAD. The Adoption of Artificial Intelligence in Firms. OECD Publishing, 2025. (OECD)

[8] Eurostat / ICT Access and Usage by Businesses Database(多份 Eurostat 及相关二次分析报告,2023–2025)(newmediasoft.de)

[9] Statistics Netherlands (CBS). Increasing use of AI by business. AI Monitor 2024. (Centraal Bureau voor de Statistiek)

[10] Omar R. Malik. The emerging AI “revolution tranquille” in America. arXiv:2505.14721, 2025. (arXiv)

[11] H. James Wilson, Paul R. Daugherty. Collaborative Intelligence: Humans and AI Are Joining Forces. Harvard Business Review, 2018. (哈佛商业评论)

[12] Human-AI Interaction 条目与相关文献汇总,Wikipedia 与引用文献,2024 更新。(维基百科)

[13] OECD.AI Policy Observatory & ICT Access and Usage by Businesses Database,关于企业 AI 采用率、障碍与政策支持的多篇报告。(OECD)

[14] Evoke Technologies. AI and predictive analytics for business strategy in Europe, 引用 McKinsey 关于预测性维护节省成本的案例。(Evoke Technologies)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

智算菩萨

欢迎阅读最新融合AI编程内容

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值