小米1
职位要求
-计算机科学、人工智能、自然语言处理或相关领域的硕士或博士学位,3 年以上相关经验;-对 SFT、PEFT、强化学习、prompt engineering、RAG、Agent等大模型相关技术有深入了解,在此领域有至少一年以上的工作经验:-对多模态技术有一定的了解,包括 ASR、TTS、视觉内容生成、端到端多模态大模型等;-具备良好的编程实现能力,熟练掌握python、pytorch、transformers等机器学习套件:-有较强的研究能力,在大模型研究领域顶级会议发表过高质量论文者优先;
-出色的问题解决能力和创新能力,能够解决复杂的技术挑战;
-良好的团队合作和沟通能力,能够与跨职能团队合作,推动项目进展。
小米2
1.围绕智能招聘、AI面试、AI会议助理、AI 办公助手、智能客服、智能审核、AI数据分析等场景利用大语言模型和多模态大模型制定解决方案并进行迭代优化,
2.与产品和业务部门密切配合,结合场景设计rewardmodel和Agent框架,利用post-training(SFT/DPO/RL等)、RAG等持续优化业务流程和场景效果。
小米3
1.负责大模型训练、对齐相关工作,包括不限于数据迭代、模型训练、模型评估。
3.结合实际场景,提供全面的技术解决方案,参与PE、推理优化、数据飞轮建设,提升大模型在应用场景的效果。
4.协助开发和优化 Al Agent 的数据采集、分析及数据闭环相关工具,支持标注工具、研发工具、数据分析与可视化系统的设计与实现,提升产研团队的工作效率
5.探索高表现力/低延迟的语音驱动的说对话系统;探索前沿的建模方式、训练策略、数据策略,以达到SOTA效果;探索AI能力的极限,并赋能产品以创造价值。
小米4
1.创新深度神经网络设计:
-
开发新颖、开拓性的深度神经网络架构,推动深度学习领域的基础研究,
-
针对多模态(文本、图像、语音等)设计优化模型提高模型的泛化能力和应用性能。
2.科学评测体系构建:
- 构建科学严谨的算法评测方法,系统评估模型的性能。
- 探索模型能力的潜在机制,推动模型优化和创新。。
3.高质量数据合成与处理:
- 通过数据生成、扩充和重写等方法,创建大规模、高质量的训练数据集。
- 结合指令调优、偏好对齐等技术提升数据质量与模型表现。
4.强化学习优化:
-
研究并实施基于RLHF/RLAIF的偏好对齐技术,提升模型在多领域的应用能力。
-
探索和优化主动学习、课程学习等有效的大模型训练方法。
职位要求
1.学术能力:
-
精通深度学习、强化学习(RL)、自然语言处理(NLP)等领域,具备创新研究能力。
-
在相关领域的国际顶会或期刊发表高质量论文(如NeurIPS、ICML、CVPR、ICLR、ACL 等)
-
在领域内知名比赛(NO1、I01、IPhO、ACM、Kaggle等)中取得优异成绩者优先。
小米5
职位描述
1.负责大模型训练、对齐相关工作,包括不限于数据迭代、模型训练、模型评估。
3.结合实际场景,提供全面的技术解决方案,参与PE.推理优化、数据飞轮建设,提升大模型在应用场景的效果。
4.协助开发和优化 Al Agent 的数据采集、分析及数据闭环相关工具,支持标注工具、研发工具、数据分析与可视化系统的设计与实现,提升产研团队的工作效率5.探索高表现力/低延迟的语音驱动的说对话系统;探索前沿的建模方式、训练策略、数据策略,以达到SOTA效果;探索AI能力的极限,并赋能产品以创造价值。
职位要求:
1.本科及以上学历,计算机、人工智能、自动化、数学专业优先;
2.对大模型的底层原理有基本理解,能跟踪语言模型和多模态领域的最新技术动向;
3.扎实的编程基础,对数据结构、算法设计基础有深度了解,熟练掌握Python/C++等主流语言一种或多种,熟练应用pytorch、megatron、deepspeed.
huggingface、transformers等深度学习框架和库;4.具备强大的工程/算法能力,能迅速迁移过往的工程/算法经验,深入理解系统底层原理并进行系统优化,能快速学习新知识;
5.有ACM/I0I/NOI/Top Coder等算法竞赛获奖经历优先;
百度
- 模型能力优化:面向百度搜索业务进行基础模型优化包括但不限于 MoE 稀疏化策略、预训练任务设计、Post-Training 任务优化,基于强化学习的推理能力增强等工作
- 模型成本优化:通过优化 MoE 路由策略、LatentAttention 结构优化等手段,提升推理效率,降低部署成本
- 算法研究与创新:组内工作发表于 ACL/NeurIPS/ICLR等会议,积极跟踪学术界和工业界技术进展,设计并实现相关算法创新,推动搜索基础模型的持续进步-跨团队协作:与数据科学家、架构工程师等跨职能团队紧密合作,确保算法方案能够有效落地
华为1
1.面向业务需求,探索并完成具有挑战性的算法解决方案的原型研发;
2、洞察先进技术,探索并研发相关算法,包括但不限于机器学习、深度学习、强化学习、非梯度优化、分布式机器学习、图像处理、NLP等;
3、面向业务的服务化能力构建: 完成场景化的算法模块化开发、离线测试、A/B测试、模型的工程化部署和模型的持续迭代将机器学习算法落地到研发流程及产品,助力数字化转型
华为2
职位描述:
1.负责大模型框架在LLM,强化学习领域,面向大规模训练、推理的系统优化工作。
2.深度掌握强化学习、LLM大语言模型算法理论知识带领AI软件栈深度系统的优化方案设计与实现。
3.积极洞察在AI系统在大规模分布式LLM,强化学习算法和系统优化领域实现系统性优化创新,整体提升AI框架核心竞争力。
4.与周边跨职能团队紧密合作,积极推广技术生态,以个人技术引领AI框架技术发展。
职位要求:
1.数学、计算机科学、人工智能等相关领域的博士学位,或具备同等的研究经验和技术水平。
2.至少3年强化学习、大语言模型(LLM)或相关算法研发经验,熟悉大语言模型、多模态模型等新型强化学习算法,掌握前沿技术,能够根据最新研究成果优化AI系统,提升易用性,更高效地适应新型算法。
3.熟悉主流大模型框架(如MindSpore、PyTorch.TensorFlow等),具备大规模场景下进行算法训练的相关经验。
4.良好的跨职能合作和沟通能力,能够与客户和团队紧密协作,推动项目的顺利实施。
5.具有AIINFRA社区(如PyTorch、VLLM、LangChain等)核心贡献者身份,或在相关开源社区中具有显著影响力者优先;在顶级学术会议(如ICML、NeurIPS等)
荣耀手机
1、负责大语言模型的Prompt Engineering、垂类应用!agent、rag等工作;
2、负责研究和洞察大模型测试体系和数据构建方法,评估大模型在理解、推理、agent、rag等全方面的能力;3、负责大模型的训练与推理工作;
4、探索跟进大语言模型的前沿技术。
任职要求:
1、对大模型rag、agent、复杂任务推理决策有一定的认识和理解,对未来的大模型技术发展有热情和信心,
2、3年以上算法开发经验,具备NLP相关的算法基础熟悉大模型的预训练、SFT、RLHF;
3、有大模型agent应用框架探索经验(如对langchain、AutoGPT等框架有深入的理解)优先,
4、有顶级会议(如ACL、NeurIPS、EMNLP等)论文发表和公开竞赛较好成绩优先,
5、熟练掌握python语言、pytorch训练框架
金山云
-
持续优化大模型底座能力,提高训练和推理性能负责 SFT、RLHF、Agent、RAG 等相关核心算法研发。
-
负责自主研发和创新 70B及以上的大语言模型,
-
设计和实现多模态大模型,并将其应用于实际业务场景。
中信银行
熟悉AIGC前沿技术,例如:CLIP,StableDiffusion,ControlNet,lmagen,Dreambooth等。结合大模型和AIGC技术,支撑PPT生成、个人简历、对话系统等多模态场景。
京东1
-
熟悉智能体技术框架,拥有成熟的项目落地经验;
-
精通大规模训练模型优化、能有效解决数据处理、模型优化、性能评估等问题
-
精通大模型优化技术,包括但不限于Pretrain、PEFT、SFT、RLHF,能够针对业务场景深度优化模型表现;
-
运用数据去噪、知识增强、知识外挂等技术,缓解或消除大模型在实际应用中的幻觉现象;
-
基于大模型技术,设计并部署高效的智能应用服务,推动业务场景的智能化解决方案,提升整体业务价值。
京东2
岗位职责
1.负责泛客服领域相关AI产品(如智能对话、智能辅助、智能质检、智能分析等)的算法研发、优化与落地。
2.应用NLP、深度学习及大语言模型(LLM)技术,提升产品智能化水平和用户体验。
3.针对具体业务场景,进行算法模型的设计、训练、调优及效果评估。
4.跟踪AI领域前沿技术(尤其NLP与大模型方向),推动技术创新在实际业务中的应用。
京东3
岗位职责:
1.探索大规模/超大规模多模态视觉大模型,并进行极致系统优化,数据建设、指令微调、偏好对齐、模型优化。
2.探索统一的多模态大模型架构,打通理解与生成之间的壁垒,研究如何在单一模型框架下实现对多模态信息的深度理解与高质量生成。
3.探索多模态推理模型(Reasoning)架构、提升多模态在学科、通用视觉任务上的思考和推理能力。4…探索多模态视觉大模型后训练方法,探索指令微调、强化学习等后训练策略,提升模型的性能
任职资格:
1.研究方向为人工智能、大语言模型、搜索推荐、强化学习,硕士以上学历;
2.在顶级期刊或国际会议(如CCF-A)上,以第一作者发表论文;或者在顶级竞赛上获奖;
3.熟悉多模态视觉大模型相关算法(LLaVa、
Chameleon、Qwen-VL、OpenCLIP等),具备相关的项目经验,
4.具有优异的理解能力和逻辑思维能力,能够在复杂场景下分解和抽象问题,提供优秀、完整、可行的解决方案;
京东4
1.作为核心成员深度参与智能体应用开发平台的产品研发工作。面向应用场景,提升智能体全链路的逻辑推理、任务规划,工具使用等能力。
2.通过构建Agent、Multi-Agent的技术框架,!将前沿技Agent能力快速应用到产品能力建设中。
3.探索如何构建稳健的评估方法,全面、客观、公正地评估模型的基础推理规划能力,以及和复杂环境的交互能力。
4.通过模型微调,蒸馏,强化学习等技术,提高多模态大模型agent模型表现
5.探索agent和业务融合实现智能工作新模式,实现组织智能的产品和技术设计,攻克前沿技术关卡。
京东金融
负责AI金融大模型的算法研究与开发,包括但不限于SFT、DPO、PPO等技术的应用与优化;
阿里支付宝
职位描述:
1、负责蚂蚁公司级重点项目建设,基于蚂蚁自研大模型及相关平台能力,结合支付宝拥有的丰富且体系化的服务生态,打造国内领先的医疗A1;
2、负责蚂蚁对话大模型平台的设计和开发,打造结合大模型的对话应用范式,支持蚂蚁核心对话场景基于大模型升级。
职位要求:
1、熟悉Java、C++或Python编程开发语言,熟悉分布式应用架构和主流中间件技术等,熟悉性能分析和优化等;
2、有对话、搜索等AI领域经验者优先,有大模型工程落地经验者优先,有langchains、rasa对话框架等项目经验者优先;
3、技术视野开阔,对新技术有探索和钻研精神,具有良好的学习能力、团队合作。
美团
岗位职责:
1.结合医疗健康业务,构建医药垂域LLM大模型,提升相关场景的能力。包括但不限于医疗问答、诊断推理、工具调用等,
2.面向在线问诊和辅助诊断场景,构建医药垂域VLM大模型,提升在医药健康领域多模态理解能力。
3.探索面向LLM/VLM优化的数据、训练、推理、评估等前沿技术和方法,推动前沿技术的落地与转化,提升技术影响力。
4.面向医药业务场景,构建医疗Agent,提升交互与系统调用能力并推动业务落地。
任职资格:
1.有医疗大模型构建和落地经验者优先;
2.优秀的探索与创新能力,在ACL/EMNLP/NAACL/NeUrIPS/ICML/ICLR等顶级会议上发表大模型相关论文者优先;
3.扎实的算法功底,在ACM/ICPC、NOI/I01、TopCoder、Kaggle等比赛获奖者优先;
4.有较强的自驱力和良好的动手实践能力,对新事物有强烈的好奇心;
滴滴
岗位职责:
1.参与基础大语言模型应用研发;
2.结合机器学习、强化学习等技术优化基础大语言模型3.调研并探索SFT/RLHF方向前沿算法、框架,持续提升现有算法的效率与效果。
任职资格:
1.有计算机科学、数学、统计学或相关领域的硕士或博士学位;
2.熟悉Python与深度学习框架,具有良好的编程能力和扎实的数学理论基础
3.关注行业前沿进展,对技术开发及应用有热情,有自己的想法并乐于挑战自我;
4.良好的沟通能力,跨团队协作能力,具备出色的规划、执行力,强烈的责任感,以及优秀的学习能力和自我驱动力;
加分项
1.有相关领域的开源项目、竞赛获奖、顶会论文发表/在投;
2.熟悉LangChain、DeepSpeed等LLM开源工具,工程能力较强。
腾讯
【岗位职责】
1、参与服务业务场景的llm大模型部署、运维、推理优化开发等相关工作;
2、负责推理加速方法的工程实现和落地,包括但不限于模型剪枝、模型量化、动态batch等方法,3、调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在搜索业务中的集成应用,
【岗位要求】
1、熟练掌握 C++/Python/Go语言,有2年以上llm大模型推理优化经验;
2、具备基础的GPU编程能力,包括但不限于Cuda、OpenCL;熟悉至少一种GPU加速库,如cublas, cudnn, cutlass;
3、有Tensorrt/Triton/sglang/vllm等推理框架的实际使用经验及二次开发经验,
4、熟悉量化、剪枝、动态Shape、算子融合等优化方法的基本原理和适用场景;
5、熟悉分布式推理常用加速方法,有超大模型分布式部署经验优先;
快手
职位描述 :
1、LLM模型应用落地:参与LLM在搜索内部的应用,探索LLM的创新落地场景;
2、RAG技术研究与落地:参与RAG技术在搜索内部的应用与创新,提升快手搜索智能问答效果;
3、技术优化与创新:持续优化现有的算法技术,推动算法创新,不断业务效果和用户体验;
4、跨团队合作:与产品团队、工程团队和业务团队紧密合作,理解业务需求,将算法技术转化为实际的产品和解决方案;
5、算法评估与改进:负责对算法模型进行评估和改进提高算法的准确性、效率和可解释性。
中国电信研究院
熟悉Deepspeed、Colossalai或Megatron等大模型训练框架者优先
虾皮科技 东南亚电商 shopee
1.负责大模型的Post-Train阶段的模型研发工作,主要是Supervised Instruction Tuning工作,增强模型的指令遵循能力。
2.提升数学推理、多语言、Agent、电商等指令遵循能力,熟悉业界的主流方法和策略。
3.提升大模型对于格式、风格、语言一致性等指令遵循
的能力。
4.跟踪并了解最新大模型领域的研究进展,制定相关的研发方案,保证模型的交付
京东方科技
1.构建基于大模型的智能数据分析引擎,提供工厂数据的智能数据分析能力;
2.构建企业运营智能体应用,提供多模态知识问答、多模态报告生成能力;
2.探索大模型在知识问答、图表理解、报告拆解、数据联动方面的应用;
3.结合BOE终端产品、业务线的实际需求,开发通用AI工作流,搭建多智能体(Multi-Agent)应用框架;任职资格:
有基于大模型的ChatBI/Agent/RAG等落地应用项目开发经验者加分,有多模态大模型训练经验者加分所需专业:
小鹏汽车
岗位职责:
1、负责对话相关核心技术算法与产品化等研发和优化工作,包括但不限于:语言模型、文字纠错、领域意图识别与切换、语义分析、槽值对提取、对话跟踪、对话生成、数据生成等。
2、参与公司产品、系统的需求分析、文档编写、技术方案制定等工作;
3、跟踪学术界和工业界相关技术的最新发展,并且能够快速应用到业务中。
职位要求:
1、计算机相关专业,本科及以上学历,5年以上开发工作经验。
2、熟悉Linux平台,有扎实的C++/Java/Python开发能力,具备良好的数据结构和算法基础。
3、熟练使用多种设计模式,具备良好的系统设计能力。4、有自然语言处理、文本挖掘、机器学习知识背景,有实战经验更佳。
5、有大数据、深度学习技术背景,或问答、对话、搜索相关项目背景者更佳
6、有较强的自学能力和钻研精神,具有良好的沟通能力和团队合作能力,综合能力强。
东方通
1.模型微调与优化
基于DeepSeek(70B/7B等)架构能设计微调方案,并对模型微调适配
设计微调效果的评估方案,并根据评估方案针对性微调
解决微调过程中遇到的种问题,如灾难性遗忘、过拟合等问题
-开发高效微调工具链(支持多GPU分布式训练、量化部署等)
2.工程化落地
实现模型从训练到服务的全链路部署(API服务/推理加速/模型蒸馏
-开发Python SDK供业务团队调用,支持模型A/B测试与效果评估
3.前沿技术探索
跟踪LLM领域新技术(如MoE、RLHF),在DeepSeek架构上实验落地
新紫光集团
1、参与分布式异构LLM推理系统的算法设计、开发与性能优化;
2、研究长序列的KV cache瓶颈问题,优化计算与通信效率;
3、研究类OpenAl o1的复杂推理(Reasoning)系统实现方案。
任职要求:
1、对Transformer为代表的LLM原理有深入理解,并具有相关实际开发经验;
2、具有大模型推理框架(如VLLM、DeepSpeed等)和训练框架(如Megatron)的开发与优化经验者优先;
3、具有计算机、通信、人工智能等相关专业背景。
美的集团
1.技术规划与团队管理
a.制定大模型预训练与后训练方向的技术路线,统筹团队研发计划,确保技术目标与业务需求对齐;
b.领导团队完成大模型架构设计、数据策略制定、训练优化及后训练调优(如微调、蒸馏、提示工程等)全流程工作;
c.负责团队技术能力建设,培养核心人才,提升团队在分布式训练、模型压缩、多模态融合等领域的技术深度。
2.跨模态技术协作
a.与语音、视觉、自然语言处理(NLP)等技术团队协同,推动大模型在多模态场景中的技术融合与创新;b.主导跨团队技术方案设计,解决多模态数据对齐、联合训练、模型适配等关键问题;
3.技术攻坚与效率优化
a.主导大规模预训练的效率优化,包括分布式训练加速、显存优化、计算资源调度等,降低训练成本;
b.研究后训练技术(如强化学习、领域适配、模型轻量化),提升模型在垂直场景中的性能与泛化能力;
c.推动模型推理性能优化,结合硬件特性设计高效部署方案。
美的2
岗位职责:
1、负责AIGC项目应用层的技术实现和交付,如知识库问答、信息抽取等;
2、负责构建、优化AIGC项目算法中台及能力;
3、引入外部大模型,部署和优化本地模型及能力;
任职要求:
1、熟悉大模型应用的全链路技术,包括训练、微调、评估、优化及产品应用经验;
2、熟悉传统的自然语言处理技术,包括分类、匹配、转换、抽取等;
3、具备丰富的AIGC应用交付经验,例如知识库问答信息抽取等,熟悉AIGC在场景应用的全流程;
4、优秀的Python/C++编程能力和算法知识,熟练掌握至少1种深度学习框架,精通主流语言大模型的原理、架构和性能分析;
5、技术加分项:模型压缩技术、模型微调技术、分布式训练;
6、本科及以上学历,5年以上算法经验,优秀的项目管理能力、沟通能力及执行力。
大麦茶
- 大语言模型应用开发:基于LLM(如GPT-4、Claude.LLaMA等)开发实际应用场景的解决方案,包括但不限于智能对话、内容生成、知识问答、数据分析等。
- 模型优化与调参:针对具体业务需求,对开源或商用大模型进行微调(Fine-tuning)、提示工程(PromptEngineering)及性能优化,提升模型效果与效率。
- 应用落地集成:将大模型能力嵌入现有产品链路,解决部署中的技术问题(如API封装、推理加速、成本控制等)
工程化支持:参与数据清洗、评估指标设计、A/B测试等全流程工作,确保模型效果可量化、可迭代
新浪微博
职位描述
1.根据业务要求对大模型进行SFT/强化学习优化,提示模型在特定场景的效果;
2.熟悉大模型的性能评估,负责各类开源模型的评估和使用;
3.跟进大模型的前沿进展,结合实际场景,提供全面的技术解决方案,参与前沿算法与应用的研究;
职位要求
1.计算机科学、人工智能、自然语言处理或相关领域的硕士或博士学位;
2.对预训练、SFT、强化学习等大模型相关技术有深入了解;
3.具备良好的编程实现能力,熟练掌握TensorFlow、PyTorch、Huggingface 等框架:4.有较强的研究能力,在大模型研究领域顶级会议发表过高质量论文者优先;
新奥
2、负责基于常见开源语言模型及视觉语言模型的后训练工作,包括LORA、全量微调、DPO、PPO等
3、负责AI搜索、RAG、Memo常见对话模块及相关应用算法开发
4、基于LangGraph、AutoGen等agent框架,参与基于LLM驱动的智能体开发
贝壳
工作职责:
1.负责搜索算法技术研发,负责搜索链路中一个或多个算法模块/模型的搭建,与工程团队协作,建设专业化的搜索系统能力。
2.使用NLP、深度学习、图学习等技术,优化查询理解相关性或召回,提升专业化的搜索体验。
3.使用深度学习、图学习、强化学习等技术,优化召回粗排、精排或混排,提升流量转化效率。
4.负责建立新型认知推荐算法体系,结合新的交互形式提升用户交互体验。
5.结合大型语言模型RAG技术,设计和优化检索增强生成系统,提高搜索系统的生成能力和准确性。
任职资格:
1.熟练掌握数据挖掘、机器学习、深度学习的基础理论和实践方法。
2.掌握常用的个性化推荐算法,具有一定大数据挖掘或
个性化推荐相关工作经验
3.对NLP、语言模型、图学习、预估排序模型中至少一
个领域有深入的理解和应用经验。
4.编程能力优秀,熟悉Java或者Python。熟悉SparkHive大数据处理工具以及TensorFlow深度学习框架。
总结的学习技术和路线
以下是从你整理的各公司(小米、百度、华为、荣耀、金山云、京东、阿里、美团、腾讯、滴滴等)大模型相关岗位中提炼出的关键技术领域与学习方向:
核心技能汇总
1. 大模型训练与微调
- Pre‑training / Post‑training
- SFT(Supervised Fine‑Tuning)
- PEFT(Parameter-Efficient Fine-Tuning,例如 LoRA、adapter)
- DPO / PPO / RLHF(包括基于强化学习的优化)
- 强化学习相关技术
- RLHF / RLAIF / PPO
- Reward model 构造与训练
- Prompt 工程学
- Prompt design 与 prompt tuning
- 基于场景的 Prompt + RAG 应用
2. 多模态与语音技术
- 多模态模型原理与工程
- 文本、图像、语音、视频联合建模
- VLM(Vision-Language Models)、CLIP、OpenCLIP、LLaVa、Qwen‑VL
- 语音技术
- ASR(自动语音识别)、TTS(文本到语音)
- 语音驱动对话系统研究
3.Agent、智能体与自动化
- 智能体架构与对话系统
- Agent 框架(LangChain、AutoGPT、LangGraph、AutoGen 等)
- RAG + agent 结合
- 多 Agent 系统设计与评估
4. 系统优化与推理工程
- 推理加速技术
- 模型剪枝、量化、动态 batch、算子融合
- Triton、TensorRT、VLLM、Cutlass、Triton Inference
- 分布式与异构推理优化
- 大规模训练工程技术
- DeepSpeed、Megatron、ColossalAI、MoE
- GPU 并行、异构计算、显存/通信优化
5. 数据与评测能力
- 数据标注、合成、数据飞轮建设
- 指令调优、偏好对齐、数据增强
- 模型评估体系构建、A/B 测试
- 幻觉检测、数据质量提升
6. 开源与社区贡献
- 核心框架贡献经验(如 PyTorch、MindSpore、VLLM、LangChain 等)
- 学术论文(ACL、NeurIPS、ICLR、ICML、CVPR 等)或竞赛经历(Kaggle、ACM、IOI、NOI 等)
7. 编程语言与工具链
- 语言:Python(必须)、C++、Java、Go
- 深度学习框架:PyTorch、TensorFlow、Hugging Face Transformers
- 推理工具:DeepSpeed、Megatron、TensorRT、Triton、VLLM 等
- 常用工具:LangChain、Rasa、Deepspeed、ColossalAI、Megatron
学习建议路线
学习维度 | 推荐技术/框架 |
---|---|
模型微调 & 强化学习 | SFT / LoRA / PEFT / DPO / PPO / RLHF、RAG pipeline |
多模态 & 语音 | CLIP、OpenCLIP、LLaVa、Qwen‑VL、ASR、TTS |
Agent 架构 | LangChain、AutoGPT、AutoGen、LangGraph 等 |
推理优化 | DeepSpeed、Megatron、TensorRT、VLLM、Triton、Cutlass |
模型训练框架 | Megatron、ColossalAI、MoE 模型 |
数据与评测 | 数据合成、A/B 测试、评测体系设计、幻觉校验 |
编程工具链 | Python、C++、Go、Python 各类支持库 |
开源社区贡献 | PyTorch、MindSpore、LLM 推理等主流项目,撰写学术论文与参与竞赛 |
从岗位要求来看,这几项技能几乎是所有大厂通用的核心:大模型微调、强化学习、多模态处理、Agent 架构、推理优化与可用性工程、数据质量与评测、开源/学术贡献。建议你根据个人阶段逐步深入:
- 从 SFT + LoRA/PEFT + Prompting + PyTorch/TensorFlow 入手;
- 再学习 RLHF/PPO/DPO + RAG,掌握 reward model 和 agent pipeline;
- 接着拓展 多模态(CLIP、图/语音处理)与 Agent 框架(LangChain 等);
- 最后深耕系统工程路径,包括 推理优化(deepspeed、TensorRT)和并行训练(Megatron)。
如果你有进一步关注的具体公司或岗位,也可以继续针对性深入。