因为外网上也对deepseek非常疯狂,所以国外大佬技术专家,oxen.ai首席架构师Gregory Sheninger,也是连夜开论文清单,精选了25篇deepseek相关的核心文献,读完就能了解90%ds相关的技术知识。
这些论文一篇一篇去不太好找,我已经全部整理好了。
获取方式1:见主页个人简介
获取方式2:点击>>推上大佬都坐不住了!DeepSeek论文清单大公开,可能是AI领域的“圣经”!
1️⃣ 架构基石:Transformer全景解析
**必读开山之作:**2017年谷歌《Attention Is All You Need》
**能力验证里程碑:**OpenAI《GPT-2》预训练范式
硬核原理可视化:Anthropic用电路理论拆解Transformer黑箱
2️⃣ 思维革命:从直觉到逻辑推理
思维链鼻祖论文:Google用提示词教会AI「一步步思考」
决策树突破:《Tree of Thoughts》实现多路径推演
**DeepSeek-R1实战秘籍:**将复杂数学题拆解为思维导图
3️⃣ 算力突围:万亿参数时代的工程哲学
**MoE奠基之作:**Google《GShard》开启模型「分科室会诊」模式
**极简路由算法:**Meta《Switch Transformers》破壁参数天花板
**国产技术巅峰:**DeepSeek-V3技术报告披露千卡集群训练秘辛
4️⃣ 价值观对齐:AI的「道德必修课」
**RLHF行业标准:**OpenAI指令微调开山研究
**自进化革命:**DeepSeek《自我奖励语言模型》实现AI自主迭代
**安全红线设计:**Anthropic宪法AI约束框架
5️⃣ DeepSeek进化论:从追赶到领跑
垂直领域杀器:《DeepSeekMath》破解奥赛级难题
**推理引擎重构:**R1技术白皮书详解纯强化学习训练流
**开源生态布局:**MoE架构商业落地全路径拆解