前言
自己从cv算法转行到LLm领域的学习路线,大多是公众号内容,简单易懂。
基础/常识/术语
基础概念,nlp相关算法,专有名词解释;常见模块介绍。
小白也能懂!这些大模型相关的词你了解多少:Token、Tokenization、Embedding......——智驻未来
万字长文深入浅出文本嵌入(Text-Embedding)技术——原力注入
文本特征向量化:词袋模型、Word2Vec 以及 TF-IDF 介绍——原力注入
Tokens究竟是啥?大模型为啥按Tokens收费?——智驻未来
想知道的都有!大模型的定义、基本架构、训练、经典代表、应用和挑战全解析——智驻未来
工作相关
工作内容常见范式,面试常见考点。
Prompt
提示词工程相关特点
小白必看!轻松入门 Prompt Engineering——智驻未来

RAG
Retrieval-Augmented Generation 检索增强生成相关介绍/范式/案例
RAG经验分享:如何选对Embedding模型?——ChallengeHub
RAG技术的知识导向综述:深度解析与前瞻——Chal1ceAI(论文解读)
Chroma 技术报告 - Evaluating Chunking Strategies for Retrieval 总结——原力注入
如何结合多模态RAG和异步调用实现大模型内容理解?——旺知识
【RAG实战 】 手把手教你从零手撸一个语义切块,解锁更多优化技巧!——ChallengeHub'
学习总结 - RAG 快速开发实战 - 《02|从0到1快速搭建RAG应用》——原力注入
为什么 RAG 会失败以及如何解决?揭秘背后三大致命缺陷!—— challengeHub
最全梳理:一文搞懂RAG技术的5种范式!——Datawhale
微调
SFT,PPO,DPO
LLM强化学习算法演进之路:MC->TD->Q-Learning->DQN->PG->AC->TRPO->PPO->DPO->GRPO———新机器视觉(转载知乎内容)
PPO & GRPO原理,小学生也能看懂!—— Datawhale
全景解读 LLM Posting-Train(后训练)技术—— 大模型新视界
workflow
工作流相关参考资料
Agent
Agent相关介绍,细节探讨。
64张图,看懂AI Agent的核心技术与未来——探索AGI
Agent的五个层次及常见的设计模式!——Datawhale
AI Agents全栈技术框架综述与未来!--DataWhale
AI Agent 究竟是啥?为啥这么多公司都在抢着做?——智驻未来
Agent是啥玩意?和传统应用有啥区别?凭啥那么拽——特大号
Agent未来已来?揭示LLM Agent技术架构与现实挑战--ChallengeHub
LangGraph Agent 架构图——ChallengeHub
AI科普-讨论-课外阅读
前沿信息,类似MCP之类的课外读物。
图灵奖得主杨立昆:大语言模型缺乏对物理世界的理解和推理能力,无法实现人类水平智能——图灵人工智能
互联网下一步,欢迎来到智能体互联网(Agentic Web)时代!——founder Park
从代码的角度理解Transformer 【附代码】——智驻未来
精|大语言模型的智能体优化全面综述:背景、有参优化、无参优化、数据基准、应用、挑战——旺知识
5000字!一文读懂大型语言模型的六大定制化策略—— 智驻未来
漫画趣解:一口气搞懂大模型蒸馏技术!——江大白转发(特大号,微信公众号)
深度学习中Attention与全连接层有啥区别?——智驻未来
大家眼中的 AI vs (牛马眼中)真实的 AI——原力注入
大模型背景下智能体、工具、函数和MCP傻傻分不清?——ChallengeHub
什么是扩展现实(XR)?VR,AR,MR(混合现实)——Nvidia企业解决方案
万字长文解读Scaling Law的一切,洞见LLM的未来——机器之心

被折叠的 条评论
为什么被折叠?



