2025大模型算法入行&转行?我建议你这样做!

最近私信问我关于入行、转行方面的问题比较多,就专门写一篇讲讲我的理解。

首先说明一下个人的背景和现状,我本人是本科学历,有互联网大厂搜推方向经验,后来跳到中厂继续做推荐,去年开始做大模型。现在是个小组长,做以应用落地为目的的大模型方向工作。有兴趣的可以翻翻我上一篇内容,讲得比较详细。因为人在中厂,分工不像大厂那么细致,所以基本上上下下都摸过,粗肯定是粗,但是可能适合谈谈全流程的认识,现在大模型算法涉及的工作主要分为这几个方向:
1.偏底层的训练和推理框架工作,比如colossal-ai、vm这些,各厂如果自建集群搭建训练推理框架的话也会有一部分工作与之重合
2.预训练;
3. Alignment;
4.应用开发;

上面也就十分粗略的简单做了个划分,其实很多界限并不清晰,只是为了后面叙述有个结构。

底层框架

这一层我是没太接触过的,不过公司内有做这方面的人。以我粗浅的认知,这些人的技术栈和以前搞GPU算子优化、分布式框架的那拨人重合度比较高。不太懂就不多说了。

预训练

在我看来,预训练这块的工作最终肯定是赢家通吃的。现在只是因为大家都还在同一个水平线上,也没有能和开源拉开差距,卖api也卖不了多少,所以看起来竞争还挺激烈。等到决出三六九等之后肯定没有必要存在那么多团队做pretrain。况且即使做pretrain的团队,真正核心在干活的也没几个人。一千张卡可能不够供一个人用,卡就那么多,配用的人也就那么多。剩下的人做的事情我觉得都不是那么有意义,不是说洗数据啥的不重要,重要,但对大多数人来说,对个人价值提升不大。我之前也自己做基于lama的继续pretrain,现在这块工作已经完全放弃了,感觉没啥意义。

再有,所谓垂直领域大模型这个事情我觉得大概率是个伪命题,各方面知识应该是相互促进补充的,遵循奥卡姆剃刀原理我相信最终就是一个模型破一切。

所以我认为虽然现在预训练目前在就业市场上可能还是有比较大的需求量的,但是很多就是纯跟风,迟早得死。对于择业的建议就是:自信自己顶级天赋顶级卷度,势要干翻gpt4的人选这个。

Alignment

我其实觉得sft和强化学习都可以放一起,不知道我这个小标题准不准确。反正都是在基座上进一步提升对话的效果。这块工作其实就开始一定程度接近业务了,比如目前,很多业务团队都会根据下游任务来构造数据进行sft训练。会不会以后基座足够强之后全靠few shot啥的就完全解决问题,这个我不敢猜测。至少在国内,基于开源模型做sft拿到业务上用,应该是挺长一段时间会保持的状态,所以这个方向看起来我觉得是目前市场上需求较大,未来一段时间也还是会持续有比较大需求量的。想训模型的可以选这个方向我觉得挺好。

应用开发

这一块的岗位其实现在大家看到的还不多,主要可能有两个原因吧,第一是openai的接口在国内直接用是有监管问题的。第二是国内开源模型的水平还不行,以及一些相关链路上的工作还没做完(比如functioncalling)。所以时机还不成熟,还不到LLMnative应
用大规模爆发的时候。

但是我觉得毫无疑问这个方向的人才需求以后将远远超出前面几个方向加起来,这就像是你搞安卓系统和
安卓应用开发的对比一样。做操作系统开发才几个人,安卓开发那真是不知道有多少了。

我预计这个时间也不会太长,一两年肯定够了,所以现在找这个方向的机会开始布局也是很不错的。不过先训训模型等真的有机会起来也没问题,毕竟你做应用开发对系统原理了解清楚肯定是优势。

其他

其实除了上面说这些,还存在一些其他的方向,比如类似guidance这样在align模型之后的,和推理框架绑定比较强的组件,我觉得以后应该会融入到推理框架的范围内。

总结

最后简单总结一下,我认为现在总体的行业形势是资本进行了大规模投入,但是基本堆在预训练上,然后这个环节也容纳不了太多人就业,而且暂时也创造不了多少商业价值。所以很有可能一段时间后会有一个下行的阶段,现在做预训练这些创业公司死一批。然后随着应用端的工作越来越多,大家慢慢把投入方向往下移,往应用端发力,这时候会有一些找准机会和方向的公司出来。顺利的话各种LLM native应用就走入千家万户。(就纯粹我自己的想象哈哈哈)

总的来说我认为LLM肯定是一个好的方向,现在进来不管做什么,也算是比较早的了解原理的人,后面做应用应该也会有一些优势。

然后就是这个东西其实没有那么大难度,有的人会鼓吹需要非常高的学历、有多少多少文章xxx才能做,我觉得没啥道理。我前面说了我是本科学历对吧,虽然我这个情况可能确实比较个例,但是如果大家看我之前写的内容就知道,很多工作其实就是在扣细节这个token对不对,训练推理一致了不xxx的。你说需要多强的数学能力啥的我觉得其实没必要。真的搞的时候也都是调库,过程中保持敏感性,细致、观察很重要。当然有很多大佬他们全方位的强,比如我看到guidance、exllama这些一两个人开发的库,作者对数学原理的熟悉、以及极强的工程实现、性能优化能力让人叹为观止,让人心向往之,但是我又不是活不到明年了,也未必就不能至吧。至少试试呗,不行再说嘛。机会留给胆大的人,我是成功了,接下来看你自己了!

在大模型时代,我们如何有效的去学习大模型?

现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。
在这里插入图片描述

掌握大模型技术你还能拥有更多可能性

• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;

• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;

• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;

• 更优质的项目可以为未来创新创业提供基石。

可能大家都想学习AI大模型技术,也_想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了让大家少走弯路,少碰壁,这里我直接把都打包整理好,希望能够真正帮助到大家_。

👉[优快云大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)]()👈

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

在这里插入图片描述

三、AI大模型经典PDF书籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

在这里插入图片描述

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

四、AI大模型各大场景实战案例

在这里插入图片描述

结语

【一一AGI大模型学习 所有资源获取处(无偿领取)一一】
所有资料 ⚡️ ,朋友们如果有需要全套 《LLM大模型入门+进阶学习资源包》,扫码获取~

👉[优快云大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)]()👈

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值