22、人工智能转型:从思维到实践的全面指南

人工智能转型:从思维到实践的全面指南

开启AI转型之旅

在当今时代,人工智能(AI)已经成为商业发展的关键驱动力。对于想要率先利用AI优势进行公司转型的商业领袖来说,AI转型是他们的答案。要快速在公司中采用现代AI,可以从以下五个关键方面入手:
1. 创造新意义 :摒弃对历史数据的单纯分析,发起创造性的变革,实现创意对齐。
2. 任命AI数据领导者 :指定专人引领AI转型的方向。
3. 聚焦专家用例 :关注涉及专家的用例,利用现有的大量工作。
4. 重新审视标注人才 :认识到公司现有的员工可能就是最佳的标注者。
5. 采用新的训练数据工具 :如AI数据存储、用户界面/用户体验(UI/UX)和工作流程等。

过去十年,AI在经典案例中取得了显著成果。如今,最大的商业机会在于监督学习,包括对生成式AI系统(如大语言模型)进行人工对齐。早期的工作往往只是简单地开展“标注项目”,就像把数据扔给某个团队,然后期待最好的结果,这并非长久之计。真正的AI转型需要思维的转变,将日常工作视为标注。

日常工作即标注

公司的日常工作都可以被视为标注。员工每天的每一个行动,无论是从字面上还是从比喻意义上来说,都是标注。关键在于如何将这些行动从每天的流失状态转变为能够以相同质量自动重复的状态。这种思维转变体现在从传统的审查工作方式到标注(对齐)的转变上。

以下是传统工作方式与以AI训练为中心的数据捕获方式的对比:
| 对比项 | 传统方式 | AI训练中心方式 |
| — | — | — |
| 日常工作性质 | 一次性工作 | 处理尚未在标注中捕获的异常情况 |
| 培训对象 | 仅针对人类 | 也针对机器 |
| 数据存在性 | 不在计算机中就不存在 | 不在训练数据中就不存在 |

这就如同从模拟时代向数字时代的转变,我们意识到如果数据不以数字形式存在,它就“不存在”。同样,在AI时代,如果数据不在训练数据中,它对公司提高生产力就没有帮助。

AI转型主要有两种类型:
1. 激发运营各方面考虑AI并建立新的报告单位 :促使公司各个运营环节都考虑AI的应用,并建立相应的报告机制。
2. 激发以训练数据为先的思维并重组报告关系 :强调训练数据的重要性,重新组织公司内部的报告关系。

经典公司通常侧重于构建大规模系统和采用AI工具,而AI产品公司则更关注跟上最新趋势、更新和AI工具的发展。

以数据为中心的AI的创造性革命

以数据为中心的AI不仅仅是关注训练数据,更重要的是创造新的数据来解决问题。这种创造性革命的思维是利用人类指导来创建新的数据点以解决问题。这有助于团队确定最佳用例,并需要任命一位训练数据总监来引领这一变革。

在以数据为中心的思维中,有两个关键方面:
1. 创造新数据
- 使用或添加新数据 :建立与现有文件和数据的新连接,采用新的传感器、相机等数据捕获方式。
- 添加新的人类知识 :进行新的对齐和标注。
例如,在自动驾驶汽车的案例中,可以创建“被截断”的含义;在体育赛事中,可以定义“犯规”的含义。
2. 改变数据收集方式 :与传统数据科学不同,训练数据可以收集新的数据。可以通过放置新的相机、发射更多卫星、安装更多医疗成像设备等方式来改变数据收集的频率和质量,从而直接提高AI性能。
3. 改变数据的含义 :在传统数据处理中,数据的含义往往是固定的。而在训练数据中,可以为原本没有意义的媒体(如图像)赋予新的含义,如“这是一个人”“这是一瓶无糖汽水”等。这种无限的创造力使得训练数据具有强大的力量。

重大项目的跨越式改进

一些AI相关的努力是需要大量人力、资源和多年时间才能完成的重大项目。以零售购物为例,通过新的方法,可以监督机器识别人们和商品的样子,从而实现完全取代收银员的全新用例,这是对购物和店铺设计方式的根本性转变。

以下是一些重大项目在捕获监督前后的概念对比:
| 概念 | 之前 | 之后 |
| — | — | — |
| 购物 | 每次购物和收银员结账的工作都被浪费 | 对购物人员进行标注 |
| 驾驶 | 每次驾驶的努力都被“浪费” | 对驾驶进行标注,专业标注人员标注常见场景,个人驾驶数据也被捕获用于辅助 |
| 文件审查 | 每次审查文件的工作都被浪费 | 对文件进行标注,工作被捕获以减少未来的类似工作 |

关键的一点是,任何可以标注的内容都可以重复。通过构建AI数据转型,可以确保公司的AI现在和未来,不仅能彻底改变现有项目,还能帮助公司在未来抵御竞争对手。

任命领导者:AI数据总监

所有的变革都需要领导者,AI转型也不例外。AI数据总监需要具备以下技能:
1. 人员领导能力 :能够领导团队,激励员工积极参与AI转型。
2. 变革推动者角色 :推动公司内部的变革,促进AI的应用。
3. 与业务需求保持一致 :了解公司的业务需求,确保AI项目与业务目标相符。
4. 跨部门沟通能力 :能够在公司的多个部门之间进行有效的沟通和协调。
5. 一定的技术理解能力 :便于与工程团队进行讨论。

不需要的背景包括:
1. 正式教育要求 :这更像是一个通过实践积累经验的角色,但实际中可能拥有MBA、科学学位等,并且需要跟上机器学习领域的最新课程。
2. 纯粹的数据科学家背景 :数据科学背景过强可能会导致过于关注算法方面,而忽视了以人类为中心的创造性方面。

总监的预算主要分为人员和工具两个部分。理想情况下,应尽早设立训练数据总监这一职位,该职位可以向AI副总裁、工程副总裁或首席技术官(CTO)汇报。

以下是训练数据生产者和数据科学消费者的对比:
| 对比项 | 训练数据生产者 | 数据科学消费者 |
| — | — | — |
| 职责 | 以数据科学可用的形式捕获业务理解和需求;创建将新数据映射回业务需求的模型;负责标注工作流程;管理数据集的创建、策划和维护;监督数据科学输出对业务问题的有效性 | 将非结构化数据转换为结构化数据;使用标注输出;使用数据集并进行轻度策划;预测输出对训练数据的有效性 |
| 关键绩效指标(KPIs) | 数据覆盖业务需求的百分比;标注返工所需的百分比;标注的数量、多样性和速度;标注的深度 | 模型性能(如召回率或准确率);推理运行时效率;GPU/硬件资源效率 |

数据科学家通常关注“我们已经有哪些关于x的数据集”或“如果有x数据集,我们就能做y”,而训练数据生产者更注重数据的生产过程。这就像饥饿时只想着吃东西,而忽略了食物的来源,但实际上两者都很重要。

在AI转型中,新的组织结构是必要的。糟糕的数据会导致糟糕的AI,AI可能会在商业环境中出现危险、失误,甚至成为负投资。同时,需要有一个主要负责人来领导AI转型战略的执行。随着参与人数的增加,需要强大的领导力和相应的预算来管理这个团队。

在预算管理方面,数据生产成本可能比数据科学成本高出一个数量级,但数据科学项目往往在预算中占据更重要的位置。为了最大化AI结果,建议采用以下AI/ML结构:
1. 数据生产 :包括插入和更新数据存储、训练数据、人类对齐、数据工程和标注等与数据生产相关的一切工作。
2. 数据消费 :包括查询数据存储的系统、工具和人员,如数据科学。
3. 支持和其他角色 :为数据生产和消费提供支持的角色。

历史上,数据科学承担了大量的硬件成本,这使得团队在构建和扩展时需要合理分配成本。将预算和团队人力投入到强大的数据生产和数据消费模型中,将最大化团队的技能,最终实现更好的AI效果。

总之,AI转型是一个全面的过程,需要从思维转变、日常工作的重新定义、创造性的数据利用到有效的领导和组织架构等多个方面进行综合考虑。通过这些努力,公司可以在AI时代取得成功,实现业务的跨越式发展。

以下是AI转型的流程mermaid图:

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px

    A[开启AI转型之旅]:::process --> B[日常工作即标注]:::process
    B --> C[以数据为中心的AI的创造性革命]:::process
    C --> D[重大项目的跨越式改进]:::process
    D --> E[任命领导者:AI数据总监]:::process
    E --> F[构建AI数据转型]:::process

这个流程展示了AI转型从开始到最终实现的主要步骤,各个步骤相互关联,共同推动公司在AI领域的发展。

人工智能转型:从思维到实践的全面指南

对未来AI的新期望

目前,让一群人进行标注的默认标准流程,就像过去的打字员团队,大量人员做着相对类似、预先设定好的工作,将一种媒介的内容转换到另一种媒介。这种“打字员式”的标注方式,无论是外包还是内部进行,在某些情况下可行,但明显效率低下且有局限性。当战略方向、本地优先级或个人工作目标发生变化时,业务单元、团队和个人层面就缺乏自主性。

如果人们将AI视为日常工作的一部分,每个新的或更新的流程都首先考虑AI转型,每个新应用都首先思考如何将工作作为标注进行捕获,每个业务部门都首先考虑标注在其工作中的作用,那会怎样呢?以下是员工对AI新期望前后的对比:
| 对比项 | 之前 | 之后 |
| — | — | — |
| 人员招聘 | 雇佣一个新的独立员工池(通常外包) | 主要依靠现有的专家和数据录入人员 |
| 项目性质 | 一次性、独立的项目 | 日常工作的一部分,就像使用电子邮件或文字处理软件一样 |
| 思维模式 | “附加”思维 | “AI优先”,假设AI会存在或要求其存在,集成系统,辅助现有工作流程 |
| AI推动方式 | AI被“强加”给员工 | 员工主动“引入”AI到组织中 |

虽然训练AI的员工可能要求更高的工资,但如果这个人与AI结合后能达到两到三个人的生产力,那么资本回报率仍然非常可观。在转型期间,可能仍然需要额外的帮助,根据业务需求,外包可能是合理的用例。但关键区别在于,标注被视为正常工作,而不是“那些人”的单独项目。

招聘专门“进行标注”而不了解公司其他情况的员工池,与直接招聘到公司的其他层级员工截然不同。例如,一家250人的公司,一夜之间招聘50人会是一件大事,但同样的公司可能认为招聘50名标注员没问题。我们应该更将其视为真正招聘50人进入公司。

当AI是事后附加的流程时,总会遇到障碍。而当组织主动引入AI,将标注视为日常工作的新部分,并直接参与标注时,机会就会更多。

提案、修正与替代

一个常见的集成提案和修正的例子是电子邮件。例如在Gmail中,当你打字时会提示建议短语,你可以接受或拒绝该短语,还可以将建议标记为“不好”,以帮助纠正未来的推荐、提案和预测等。

这凸显了在未来购买产品时的一个重要考虑因素,也再次强调了使用AI提高员工生产力,而不是直接替代他们的主题。

上游生产者与下游消费者

训练数据工作是数据科学的上游。训练数据流程中的失败会影响到数据科学(如下图所示),因此确保训练数据的正确性非常重要。

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px

    A[训练数据生产]:::process --> B[数据科学使用]:::process

训练数据和数据科学之间的关系可以看作是生产者和消费者的关系,具体对比如下:
| 对比项 | 训练数据 - 生产者 | 数据科学 - 消费者 |
| — | — | — |
| 核心职责 | 以数据科学可用的形式捕获业务理解和需求;创建将新数据映射回业务需求的模型;负责标注工作流程;管理数据集的创建、策划和维护;监督数据科学输出对业务问题的有效性 | 将非结构化数据转换为结构化数据;使用标注输出;使用数据集并进行轻度策划;预测输出对训练数据的有效性 |
| 关键绩效指标 | % of business need covered by data;% of annotation rework required;volume, variety, and velocity of annotation;Depth of annotation | 模型性能(如召回率或准确率);推理运行时效率;GPU/硬件资源效率 |

数据科学家通常会想“我们已经有哪些关于x的数据集”或“如果有x数据集,我们就能做y”,就像饥饿时只想着吃东西,而忽略了食物的来源。但实际上,训练数据的生产者就像农民一样,对整个过程同样重要。

深入数据科学领域后,关注点往往更多地放在数据的消费上,而不是生产上。数据科学的数据消费步骤通常比较明确,例如一次性映射。但大规模AI数据生产过程中的人类交互和持续挑战,才是训练数据专家需要关注的重点。

新结构的必要性

糟糕的数据会导致糟糕的AI,AI可能在商业环境中出现危险、失误,甚至成为负投资。其次,AI转型需要有一个主要负责人来领导战略的执行。虽然副总裁或首席执行官可以在战略层面发挥作用,但AI总监负责执行该战略,这个角色对AI项目的成功至关重要。新角色将有助于总监围绕数据建立所需的思维和工具,为此他们必须在公司内拥有适当的权力。

随着参与人数的增加,这实际上是一个需要管理的大型团队。即使是小团队(按大公司标准)也可能至少有一两名生产经理和二十到五十名标注生产者。在大型组织中,可能有数百甚至数千名标注生产者,他们都在努力使多个AI和AI工具与商业利益保持一致。这需要强大的领导力和相应的预算。

在预算管理方面,数据生产成本可能比数据科学成本高出一个数量级,但数据科学项目往往在预算中占据更重要的位置。为了最大化AI结果,建议采用以下AI/ML结构:
1. 数据生产 :包括插入和更新数据存储、训练数据、人类对齐、数据工程和标注等与数据生产相关的一切工作。
2. 数据消费 :包括查询数据存储的系统、工具和人员,如数据科学。
3. 支持和其他角色 :为数据生产和消费提供支持的角色。

历史上,数据科学承担了大量的硬件成本,随着团队的构建和扩展,需要合理分配成本。将预算和团队人力投入到强大的数据生产和数据消费模型中,将最大化团队的技能,最终实现更好的AI效果。

总之,AI转型是一个复杂而全面的过程,它涉及思维模式的转变、日常工作方式的重新定义、数据处理的创新以及有效的领导和组织架构。通过全面实施这些策略,企业能够在人工智能时代保持竞争力,实现可持续的增长和发展。从思维的转变开始,到具体的实践操作,每一个环节都紧密相连,共同构成了AI转型的蓝图。企业需要根据自身的实际情况,灵活运用这些方法,逐步推进AI转型,以适应不断变化的市场环境和技术发展趋势。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值