吴恩达:别盲目跟风模型微调,75%的团队其实不需要这么做

“在微调之前,请先尝试提示工程或智能体工作流,这可能会带来更简单、更易于维护的解决方案。”

img

随着AI技术的发展,模型微调成为了一个热门话题。在日常与客户沟通的过程中,经常会遇到来自研发团队的问题:究竟什么时候该用微调(Fine-tuning)?什么时候不该用?

吴恩达基于在多家公司的实践经验,深入剖析了模型微调的适用场景。他指出,目前约75%使用微调的团队其实可以通过更简单的方法达到目标

不过在三种场景下,微调确实是最佳选择:

  1. 提升关键应用的准确性
  2. 学习特定的沟通风格
  3. 降低模型延迟和成本

吴恩达还特别提到,借助LoRA等技术,微调所需的数据量比想象的要少得多,有时仅需100个示例就能取得不错效果。对于想要入门模型微调的团队来说,这是一份难得的参考指南。

01模型微调比你想象的要复杂

尽管微调是一项重要且有价值的技术,但当前使用它的许多团队其实可以通过更简单的方法获得不错的效果,比如提示工程(包括编写超长提示)、少样本提示或简单的智能体工作流

为什么这些团队不该选择微调?因为微调需要对预训练模型进行针对特定应用的额外训练,实现起来相对复杂。

你需要收集训练数据,然后(除非你想自己实现微调)找到服务商协助运行微调,最后还要部署微调后的模型。由于它在训练和部署上都增加了额外复杂度,通常我只有在发现提示工程和简单智能体工作流无法胜任任务时,才会采用这项技术

话虽如此,在某些应用场景下进行微调是恰当且有价值的。LoRA(通过修改有限数量的参数而非整个模型来学习)及相关方法使得微调变得相当经济实惠,特别是对于小模型(比如 13B 或更少参数)。而且入门所需的数据量比大多数人想象的要少。根据应用场景,我曾见过仅用 100 个甚至更少的示例就能取得良好效果。

以下是几个微调成功的应用场景。

02提升关键应用的准确性

对于许多应用来说,提示工程(prompting)能让你走得很远。但有时,微调(fine-tuning)能帮你榨取出最后那一点准确度

例如,如果你正在构建一个客服聊天机器人,需要它可靠地调用正确的 API(比如执行交易、发放退款等),或许通过提示能让它在 95%的情况下做出正确的 API 调用。

但如果你即使修改提示也难以提高准确度,而你又确实需要 99%的准确率,那么基于对话和 API 调用的数据集进行微调,可能是达成目标的理想方式。对于那些仅用语言难以明确指定操作规则的任务来说尤其如此。

例如,当客户感到不满时,聊天机器人应该升级给经理处理,还是直接发放退款?团队通常会为人类员工编写标准操作流程(SOP),这些 SOP 可以放入模型的提示中。

但如果难以制定明确的 SOP,甚至人类也需要看过大量示例才能学会如何处理,那么微调可能是个好方法。 在许多文本分类应用中,微调同样表现优异,例如将医疗记录分类为健康保险索赔的诊断代码和操作代码。

03学习特定的沟通风格

正如吴恩达在《面向所有人的生成式 AI》中所述,通过微调模型使其表达方式与个人的表达风格相似。许多人(包括我自己)都有独特的语言使用习惯。有些词汇我倾向于使用,而另一些则较少提及,这些细微差别数量庞大且难以通过文本提示精确指定。若要让系统以特定风格交流,相较于单纯依赖提示,微调通常是更优的解决方案。

包括一些特定的输出格式。例如 AI 出题以及 AI 生成问卷等场景,因为输出结果包含了多种不同类型的选项(单选、多选、填空以及参考答案等类型),且这些格式往往由应用自定义,这种情况下就需要对模型做一定程度的微调,确保输出的格式能够正确地被前端页面进行渲染。

04在扩大规模时降低延迟或成本

我见过一些应用场景,开发者通过提示工程的方式,成功引导大模型执行复杂任务。但随着使用规模扩大,如果大模型速度过慢(这种情况经常发生)或成本过高(虽不常见但确实存在),团队可能希望改用小模型。

但若小模型性能不足,通过微调可以使其在该特定应用中达到与大模型相当的水平。此外,大模型(或基于代理的工作流)还能生成数据,帮助针对该任务微调小模型。

05写在最后

在研究的前沿领域,一些团队正在微调模型以提高对特定语言的理解能力。但除了少数例外,如果目标是让大模型更好地理解其训练数据中未包含的知识体系,使用 RAG(检索增强生成)是一种更为简便的方法。我仍偶尔会遇到一些团队采用微调方式,而我认为 RAG 在这些情况下效果会更佳。

总体而言,我的感觉是,在所有我看到使用微调的团队中,大约 75%可以通过更简单的技术(如提示或代理工作流)获得良好的结果,但在 25%的情况下,我不知道有更好的方法来实现他们的目标。

在技术上,实现微调、正确设置超参数、优化计算资源等仍然具有挑战性。幸运的是,越来越多的公司努力优化这些方面,并提供高效的微调服务。

其中许多公司允许我们对开放权重模型进行微调,并下载微调后的权重。有些则允许我们对其封闭模型进行微调,但微调后的权重仍保持封闭。这两种方式都很有用,但前者具有明显的可移植性优势,且不必担心提供商会停止对特定模型的支持,导致我们软件中的关键组件被弃用。

总之,在微调之前,请先尝试提示或智能体工作流,这可能会带来更简单、更易于维护的解决方案。我的团队构建的绝大多数应用程序根本不使用任何微调,但它是少数关键部分之一。

普通人如何抓住AI大模型的风口?

=领取方式在文末==

为什么要学习大模型?

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:

在这里插入图片描述

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

最后

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

大模型全套学习资料领取

这里我整理了一份AI大模型入门到进阶全套学习包,包含学习路线+实战案例+视频+书籍PDF+面试题+DeepSeek部署包和技巧,需要的小伙伴文在下方免费领取哦,真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

部分资料展示

一、 AI大模型学习路线图

整个学习分为7个阶段
在这里插入图片描述
在这里插入图片描述

二、AI大模型实战案例

涵盖AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,皆可用。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

三、视频和书籍PDF合集

从入门到进阶这里都有,跟着老师学习事半功倍。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

四、LLM面试题

在这里插入图片描述
在这里插入图片描述

五、AI产品经理面试题

在这里插入图片描述

六、deepseek部署包+技巧大全

在这里插入图片描述

😝朋友们如果有需要的话,可以V扫描下方二维码联系领取~
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值