研一刚入学导师让我搭各种LLM的Ai Agent框架,应该往什么方向努力才能出成果呢?

现在研一刚入学导师一直让我们复现各种各样的aiagent框架,想在之后开发自己的agent的框架,我有点没有方向感,复现了一个又一个框架但是不知道有什么意义也不知道怎么做才能出成果,请问我现阶段在看那些最新的aiagent框架的时候应该将重心放在什么地方,往什么方向发展比较好能够出成果呢,是否需要学习底层机器学习的课程或者其他基础课程,感谢指点~

Agent的狂欢基本已经结束了,不建议继续纯做这个,起码得加点多模态和ml,dl了。

具体可以看看各家公司的agent都到什么水平了,比如网易逆水寒这种,别人已经纯商业赚钱了,你如果不如人家的,大概率还是很难。

今天刚中了nips,也是llm agent的工作。

有需要的话,我可以写一下自己对这方面的经验。

现在llm agent的工作好几类,而我主要是关注游戏方面的,所以有些地方肯定是没写清楚或者有错误,还希望多多包涵。

第一种可以称之为博弈类,或者mallm类。

这类一般是以前做过marl的人转战llm agent,把之前的marl里面的方法拿过来各种套。大部分工作都会在矩阵博弈,overcook这种环境做,主要目标还是涨点啥的。个人不是很喜欢,不过做的人不少,毕竟科研也是工作的一种,能发文章的方向肯定是好方向,只不过找工作这个就不太实际了。

第二种可以称之为游戏类,虽然博弈也叫game,但这里指的还是真正有人玩的游戏,起码得有受众。

这类又可以细分,一类是构建文本化的环境,比如civrealm,llm play sc2(我做的,自卖自夸一下),还有各种兵棋。这类主要考验你对这些游戏的掌握程度,通过各种接口想办法去保证游戏的文本空间的合理映射。

最近安波老师的多模态agent cradle也很火,带领了一波多模态的浪潮,比如现在的黑神话悟空,也有人开始这么做了。

剩下的就是经典的打牌下棋了,这个也有不少,从象棋围棋到掼蛋,大家都做了一遍。

这一类的问题就是,上一波rl大火的时候,能训练的游戏基本都是超越人类的水平了,llm/mlm agent的优势和特点在哪里,这是需要解决的。

第三类可以说是各种具身智能,不过由于现在啥都叫具身智能了,我这里就只讲机器人了。这个领域我不熟悉,也没看过多少工作,但一般有真机的工作要更扎实一点,很多会议也要求有真机的。纯仿真里搞这些,就不大好了。

第四类是模拟类的,比如模拟一个人,模拟一个社会这种。

现在有的工作,比如斯坦福小镇,模拟Twitter,还有模拟选举什么的。其实和游戏类差不多,有的甚至就在游戏里面搞的。我们需要设计合理的机制,做好前后端接口,把一个真实的社会给仿真出来,尽可能让大模型像每一个性格迥异的人。

这里有几个问题很难解决,第一是仿真器怎么做,斯坦福小镇的爆火就是他们可视化做的好,后续大家都在unity里开发了。第二是怎么保证个性化和智力,大模型经过rlhf之后,很难让它细粒度的扮演一个人进行决策,主流的商业模型都会给出一个很中庸的回答,根本没法用。第三是怎么支撑起几百,甚至几百万的agent交互,这个很复杂,方法很多,但花的钱肯定不少。

当然有些人是没有前端渲染的工作,多快好省,这其实不太好,因为这个领域Demo胜过一切,你连一个好看的Demo都没有,别人肯定是不会浪费时间看你的工作。

第五个才是现在最有用的agent,比如客服问答,rag这种,做的人很多,很卷,但是真的能落地赚钱。这方面我完全不熟,希望有人补充。

第六个可以说是tool use之类的工作,比如hugginggpt什么的,现在也很火,该赚钱的已经都在赚钱了,公司也非常看中这个,毕竟这些是真的能提升生产力。

第七个是自动化流水线,比如metagpt写代码,各种生物化学的agent用来合成东西,发现和分析数据啥的。代码类现在吹得很凶,但效果还是很难做好,毕竟严重依赖基础模型。而ai for science这类的,主要靠py和science端的知识,cs的学生肯定是没这品味,也没这兴趣去搞这种(毕竟我就是生物本科,我感觉大部分做ai for science的同学,根本不了解真正的基础研究)。

发现忘记写minecraft了,由于23年做他们的人太多了,特此把他从游戏类提出来单独写一下。

有三类,第一类纯rl,大家以前做的比较多,比如Minecraft有openai做的那个,从视频里学习的。

第二类是纯llm,这个就满天飞了,什么Voyager,ghost in Minecraft,非常多,一般都是技能库,调用代码什么的,相信大家看过很多Demo了。当然最近也有1000个agents的这种,这种其实主要是因为minecraft本身游戏比较好,能支持这么agent进去,有钱加上合理的设计,肯定能做出来。

第三种是llm+rl,有设计reward的,有存储技能书的,也是一大堆,不少都中了顶会。

minecraft竞争过于激烈,不建议大家再搞了,除非你有信心战胜10个清华博士全力开卷的能力。

所以总结一下,大部分的agent领域低垂得果实,都已经被摘完了,22年底到23年的那种随便调调api,编点故事就乱发的美好时代已经过去了。当然对于老师来说,他们往往才开始了解,所以不懂这个竞争 多惨烈,只能看到别人xxx都能发,我们为什么不能。

如果大家想继续做这个方向,那就得想清楚自己擅长什么。大模型的商业化实际上是依赖agent的,没有公司支持的大模型研究,基本都是搞笑的,公司不但会提供商业场景,也会提供资源支持,而高校这种小打小闹,在如今是完全行不通的。

毕竟大模型就是个工程活,不要老觉着自己是在做科研,你和纯数,生化环材的比一下,就知道自己在做啥了。

那么,如何快速系统的去学习大模型LLM?

作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~

在这里插入图片描述

👉大模型学习指南+路线汇总👈
我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。

在这里插入图片描述

9周快速成为大模型工程师

第1周:基础入门
  • 了解大模型基本概念与发展历程

  • 学习Python编程基础与PyTorch/TensorFlow框架

  • 掌握Transformer架构核心原理

  • 在这里插入图片描述

第2周:数据处理与训练
  • 学习数据清洗、标注与增强技术

  • 掌握分布式训练与混合精度训练方法

  • 实践小规模模型微调(如BERT/GPT-2)

第3周:模型架构深入
  • 分析LLaMA、GPT等主流大模型结构

  • 学习注意力机制优化技巧(如Flash Attention)

  • 理解模型并行与流水线并行技术

第4周:预训练与微调
  • 掌握全参数预训练与LoRA/QLoRA等高效微调方法

  • 学习Prompt Engineering与指令微调

  • 实践领域适配(如医疗/金融场景)

第5周:推理优化
  • 学习模型量化(INT8/FP16)与剪枝技术

  • 掌握vLLM/TensorRT等推理加速工具

  • 部署模型到生产环境(FastAPI/Docker)

第6周:应用开发 - 构建RAG(检索增强生成)系统
  • 开发Agent类应用(如AutoGPT)

  • 实践多模态模型(如CLIP/Whisper)

在这里插入图片描述

在这里插入图片描述

第7周:安全与评估
  • 学习大模型安全与对齐技术

  • 掌握评估指标(BLEU/ROUGE/人工评测)

  • 分析幻觉、偏见等常见问题

第8周:行业实战 - 参与Kaggle/天池大模型竞赛
  • 复现最新论文(如Mixtral/Gemma)
  • 企业级项目实战(客服/代码生成等)
第9周:前沿拓展
  • 学习MoE、Long Context等前沿技术
  • 探索AI Infra与MLOps体系
  • 制定个人技术发展路线图
    在这里插入图片描述
    👉福利篇👈
    最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员一粟

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值