大家好,我曾是一名写了近十年代码的“老”程序员,如今是一名大模型工程师。这个转身,充满了好奇、焦虑、兴奋与成长。我想把我的故事分享给你,希望能给正在观望或同样在路上的你一些启发。
1. 我的成长路径
我的技术生涯始于传统的后端开发。从Java到Go,我精通各种业务CRUD,设计过微服务架构,也处理过令人头疼的线上故障。我沿着“初级->高级->专家”的路径稳步上升,成为了团队里的技术骨干。
然而,大概在三年前,我感受到了强烈的瓶颈。我发现我的工作越来越多地是“重复”和“优化”,那种从零到一创造一个新事物的兴奋感越来越稀缺。我就像一颗优秀的“螺丝钉”,虽然牢固,但视野被限制在特定的业务模块里。我开始渴望接触更前沿、更具颠覆性的技术。
2. 为什么转行AI大模型
原因有三,层层递进:
- 技术好奇心的驱使: 当ChatGPT横空出世时,我和所有程序员一样,被其“恐怖”的通用能力所震撼。这不再是那个我印象中只能做做分类、检测的“传统AI”。它仿佛拥有了“理解”和“创造”的能力。作为一个技术人,我本能地想去弄明白它到底是怎么工作的。
- 对职业天花板的焦虑: 我预感到,大模型这种范式革命,将会重塑很多行业,也包括软件开发本身。如果我不主动拥抱变化,可能在未来某天就会被变化所淘汰。我不想等到35岁危机真正来临时才被动应对。
- 价值感的追寻: 作为后端,我的价值体现在“支持业务稳定运行”。而大模型工程师,则是在直接“创造智能”,让机器能够理解、对话、推理。这种亲手打造“智能体”的成就感,对我有着致命的吸引力。
3. 如何转行AI大模型
转行绝非一蹴而就,我把它分为三个阶段:
-
第一阶段:疯狂输入,建立知识框架。
- 基础理论: 我重新捡起了数学(线性代数、概率论),并系统学习了李宏毅、吴恩达的LLM相关课程。重点是理解Transformer架构、注意力机制、预训练、微调(SFT、LoRA等)、强化学习(RLHF)这些核心概念。
- 技术栈: 我把Python从“会用”提升到了“精通”的水平,并深入学习了PyTorch和Hugging Face生态系统。这是我新的“武器库”。
-
第二阶段:动手实践,用项目说话。
- 光说不练假把式。我从最简单的任务开始:用开源模型(如ChatGLM、Llama)在本地部署,写一个聊天对话的Demo。
- 然后,我尝试用LoRA等技术在特定领域的数据集(如医疗问答、法律条文)上对模型进行微调,让它在某个垂直领域表现更好。
- 最后,我完成了一个完整的个人项目:构建了一个基于RAG的智能知识库问答系统。这个项目涵盖了文档解析、向量数据库、Embedding、Prompt工程等多个核心环节,成为了我面试时最有力的证明。
-
第三阶段:融入社区,保持信息敏感。
- 我活跃在GitHub、知乎、ArXiv上,关注顶会论文和开源项目。在这个领域,不学习就会被瞬间甩开。
4. 找AI大模型的工作
准备充分后,我开始投递简历。目标很明确:大厂或顶尖AI创业公司的“大模型应用/微调”相关岗位。
- 面试重点: 面试官不再仅仅关心我写过多少行业务代码。他们深入考察:
- 对LLM原理的理解深度: 比如会问“为什么RoPE位置编码比绝对位置编码更好?”。
- 工程实现能力: 如何组织数据处理流水线?如何评估模型效果?如何解决显存溢出(OOM)的问题?
- 项目经验: 我的RAG项目被反复拷问,从设计思路到每一个技术选型的理由。
- 学习能力和热情: 他们很看重我转行的动机和持续学习的行动。
最终,我拿到了几个不错的Offer,并选择了加入腾讯,开启了我的大模型生涯。
5. 腾讯内的成长
在腾讯,我进入了一个纯粹的大模型团队。这里的成长是指数级的:
- 从“玩具”到“工业级”: 个人项目处理的是百万级数据,而在这里,面对的是千亿token、PB级别的训练数据。我真正理解了分布式训练、稳定性保障、成本控制的挑战。
- 深度参与模型迭代: 我从一个模型的“使用者”变成了“建设者”,参与了从数据清洗、配方设计、SFT微调到效果评测的全链路。这种亲眼看着模型在自己手中“成长”起来的感觉,无比奇妙。
- 顶尖的同行者: 身边都是国内最优秀的AI工程师和研究员,每一次讨论都是思想的碰撞和知识的提升。
6. 比较好的习惯,有利于我长期在一线冲锋
在这个快速迭代的领域,保持一线战斗力至关重要。我有两个核心习惯:
- 保持动手:绝不脱离代码。 无论头衔如何变化,我每周都会保证自己亲手写代码、跑实验、看日志。对技术的“手感”是工程师最宝贵的财富,一旦失去,判断力就会下降。
- 乐于分享,费曼学习法。 我坚持在团队内做技术分享,也通过写文章、做笔记来梳理自己的知识。“教”是最好的“学”。当你试图把一个复杂概念给别人讲明白时,你自己的理解也会深化一个层次。
7. 为什么离职转行AI大模型
看到这里你可能会有疑问:“你在腾讯不是发展得很好吗?为什么最终还说是‘离职转行’?”
这是一个非常关键的点。我是在腾讯内部完成了转型的初期积累,但最终选择离开,加入一家专注于大模型技术的创业公司。
原因在于,在腾讯这样的大平台,大模型业务往往是宏大布局中的一部分。我个人更渴望一种极致的专注和更快的迭代速度。在创业公司,我可以更直接地感受到市场的脉搏,决策链条更短,能够把所有精力都投入到我最热爱的大模型核心技术研发上。这个决定,是为了追求更极致的专业深度和一种“从0到1”的创业激情。
总结一下:
从程序员到大模型工程师,是一场“破圈”之旅。它需要你跳出舒适区,用归零的心态重新学习,更需要你用强大的动手能力将理论付诸实践。这条路很卷,也很辛苦,但沿途的风景和最终的视野,绝对值得你为之奋斗。
如果你也心动了,那么,现在就开始吧。
那么,如何系统的去学习大模型LLM?
如果你也想系统学习AI大模型技术,想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习*_,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。
为了帮助大家打破壁垒,快速了解大模型核心技术原理,学习相关大模型技术。从原理出发真正入局大模型。在这里我和MoPaaS魔泊云联合梳理打造了系统大模型学习脉络,这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码免费领取🆓**⬇️⬇️⬇️

【大模型全套视频教程】
教程从当下的市场现状和趋势出发,分析各个岗位人才需求,带你充分了解自身情况,get 到适合自己的 AI 大模型入门学习路线。
从基础的 prompt 工程入手,逐步深入到 Agents,其中更是详细介绍了 LLM 最重要的编程框架 LangChain。最后把微调与预训练进行了对比介绍与分析。
同时课程详细介绍了AI大模型技能图谱知识树,规划属于你自己的大模型学习路线,并且专门提前收集了大家对大模型常见的疑问,集中解答所有疑惑!

深耕 AI 领域技术专家带你快速入门大模型
跟着行业技术专家免费学习的机会非常难得,相信跟着学习下来能够对大模型有更加深刻的认知和理解,也能真正利用起大模型,从而“弯道超车”,实现职业跃迁!

【精选AI大模型权威PDF书籍/教程】
精心筛选的经典与前沿并重的电子书和教程合集,包含《深度学习》等一百多本书籍和讲义精要等材料。绝对是深入理解理论、夯实基础的不二之选。

【AI 大模型面试题 】
除了 AI 入门课程,我还给大家准备了非常全面的**「AI 大模型面试题」,**包括字节、腾讯等一线大厂的 AI 岗面经分享、LLMs、Transformer、RAG 面试真题等,帮你在面试大模型工作中更快一步。
【大厂 AI 岗位面经分享(92份)】

【AI 大模型面试真题(102 道)】

【LLMs 面试真题(97 道)】

【640套 AI 大模型行业研究报告】

【AI大模型完整版学习路线图(2025版)】
明确学习方向,2025年 AI 要学什么,这一张图就够了!

👇👇点击下方卡片链接免费领取全部内容👇👇

抓住AI浪潮,重塑职业未来!
科技行业正处于深刻变革之中。英特尔等巨头近期进行结构性调整,缩减部分传统岗位,同时AI相关技术岗位(尤其是大模型方向)需求激增,已成为不争的事实。具备相关技能的人才在就业市场上正变得炙手可热。
行业趋势洞察:
- 转型加速: 传统IT岗位面临转型压力,拥抱AI技术成为关键。
- 人才争夺战: 拥有3-5年经验、扎实AI技术功底和真实项目经验的工程师,在头部大厂及明星AI企业中的薪资竞争力显著提升(部分核心岗位可达较高水平)。
- 门槛提高: “具备AI项目实操经验”正迅速成为简历筛选的重要标准,预计未来1-2年将成为普遍门槛。
与其观望,不如行动!
面对变革,主动学习、提升技能才是应对之道。掌握AI大模型核心原理、主流应用技术与项目实战经验,是抓住时代机遇、实现职业跃迁的关键一步。

01 为什么分享这份学习资料?
当前,我国在AI大模型领域的高质量人才供给仍显不足,行业亟需更多有志于此的专业力量加入。
因此,我们决定将这份精心整理的AI大模型学习资料,无偿分享给每一位真心渴望进入这个领域、愿意投入学习的伙伴!
我们希望能为你的学习之路提供一份助力。如果在学习过程中遇到技术问题,也欢迎交流探讨,我们乐于分享所知。
*02 这份资料的价值在哪里?*
专业背书,系统构建:
-
本资料由我与MoPaaS魔泊云的鲁为民博士共同整理。鲁博士拥有清华大学学士和美国加州理工学院博士学位,在人工智能领域造诣深厚:
-
- 在IEEE Transactions等顶级学术期刊及国际会议发表论文超过50篇。
- 拥有多项中美发明专利。
- 荣获吴文俊人工智能科学技术奖(中国人工智能领域重要奖项)。
-
目前,我有幸与鲁博士共同进行人工智能相关研究。

内容实用,循序渐进:
-
资料体系化覆盖了从基础概念入门到核心技术进阶的知识点。
-
包含丰富的视频教程与实战项目案例,强调动手实践能力。
-
无论你是初探AI领域的新手,还是已有一定技术基础希望深入大模型的学习者,这份资料都能为你提供系统性的学习路径和宝贵的实践参考,助力你提升技术能力,向大模型相关岗位转型发展。



抓住机遇,开启你的AI学习之旅!

1401

被折叠的 条评论
为什么被折叠?



