
LLM与Agent
文章平均质量分 95
从理论和代码实现两个方面,探索LLM与Agent的奥秘,在即将到来的AI大航海时代逐浪前行
JimmyTotoro
大厂算法工程师,专注搜索和NLP方向多年;AGI大航海时代弄潮儿
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
DeepSeek-R1解读:纯强化学习,模型推理能力提升的新范式?
本文通过对Deepseek-R1技术报告的解读,带你深入理解强化学习如何在Deepseek-R1中重塑LLM的post-training进程原创 2025-01-26 21:56:05 · 917 阅读 · 0 评论 -
大模型参数高效微调技术(PEFT)探究
Parameter-EfficientFine-Tuning(PEFT,参数高效微调)技术旨在通过最小化微调参数的数量和计算复杂度,来提高预训练模型在新任务上的性能,从而缓解大型预训练模型的训练成本。原创 2025-01-19 19:26:07 · 832 阅读 · 0 评论 -
一文详尽之Embedding(向量表示)!
在大模型时代,embedding(向量表示)的重要性愈发凸显。不论是在RAG(Retrieval-AugmentedGeneration)系统,还是在跨模态任务中都扮演着关键角色。本文带你详细了解文本向量的前世今生,让你能够更好地了解向量,使用向量。原创 2025-01-19 18:44:11 · 1532 阅读 · 0 评论 -
论文阅读 METAGPT: META PROGRAMMING FOR A MULTI-AGENT COLLABORATIVE FRAMEWORK
METAGPT首先提出了模拟人类标准化操作流程(SOPs)的多agent协作框架去解决AI自动化编程问题,有效地解决了基于聊天的多agent系统面临的级联幻觉问题。同时提出了基于结构化信息的跨agent通信协议,要求不同的agent按照其特定角色和背景提供必要的结构化输出。原创 2025-01-16 21:49:40 · 1322 阅读 · 0 评论 -
Tiny-universe学习笔记:Qwen-blog
本文是参与[DatawhaleTiny-universe组队学习](https://github.com/datawhalechina/tiny-universe)的学习笔记第一篇,笔记中的代码均参考transformers-4.39.3中的Qwen2模型实现,基于torch开发,代码路径为transformers-4.39.3/src/transformers/models/qwen2。原创 2024-05-15 20:55:18 · 2871 阅读 · 0 评论 -
论文阅读 AutoDev: Automated AI-Driven Development
为什么要读这篇论文?学习一个coding agent的技术架构,建立对coding agent架构的基本认知。在此基础上再进一步探究MetaGPT、LDB、AgentCoder等业界SOTA coding agent的技术架构。原创 2025-01-15 17:10:06 · 1144 阅读 · 0 评论