
学术研究综述
文章平均质量分 95
歌刎
苍云道,陈云青
展开
-
AAAI 2025 杰出论文揭晓:顶尖AI研究聚焦多智能体优化、神经符号推理与生物多样性计算
本文聚焦人工智能领域顶级会议 AAAI 2025,该会议于 2 月 25 日 - 3 月 4 日在美国费城举行,录用率 23.4%。会议公布的杰出论文奖成果显著。南京大学周志华团队等三篇论文获奖,还有一篇获 “AI 对社会影响特别奖”。获奖论文涵盖多智能体优化、神经符号推理等前沿方向,如周志华团队提出溯因反思框架解决神经符号推理冲突,多伦多大学优化算法降低多智能体匹配失真度等。这些研究不仅实现理论突破,还在医疗、资源分配等多领域有重要应用,为智能技术 “向善” 发展注入新动力,再次印证 AI 在学术与产业的原创 2025-03-04 00:14:38 · 3248 阅读 · 0 评论 -
DeepSeek近日发布论文Native Sparse Attention:硬件对齐且可原生训练的稀疏注意力机制
本文聚焦于自然语言处理领域长序列建模的难题,介绍一种名为 NSA(Natively trainable Sparse Attention)的硬件对齐且原生可训练的稀疏注意力机制。阐述了其核心贡献、技术突破点及现实影响,包括首次实现硬件对齐的稀疏注意力机制,在长序列处理上显著提升效率等。详细说明了其方法原理、整体框架、算法设计、内核设计,通过实验对比评估其性能,分析效率,并探讨了相关工作、替代策略的挑战、可视化结果等,最后总结了 NSA 在长上下文建模中的优势和前景。文中还提供了论文地址、代码仓库及领域专家原创 2025-02-24 18:02:13 · 1272 阅读 · 0 评论 -
DeepSeek R1 “顿悟时刻”(Aha Moment) 的重现与探索:基于 GRPO 的倒计时游戏训练
本文聚焦于 DeepSeek R1 的发布,介绍了其在行业中的震撼影响。作者尝试使用组相对策略优化(GRPO)和倒计时游戏重现 DeepSeek R1 的 “顿悟时刻”。文中详细阐述了开发环境设置、训练样本生成、使用 GRPO 训练模型(包括奖励函数的定义和训练参数设置)、分布式训练示例、训练结果观察等内容。原创 2025-02-10 21:09:45 · 1145 阅读 · 0 评论 -
DeepSeek R1 大模型信息汇总!本地部署与使用技巧大全
想掌握 DeepSeek R1 大模型的使用技巧吗?这篇文章帮你搞定。文中会为你提供超详细的本地部署教程,哪怕是技术小白也能轻松上手。此外,还分享了丰富的新手和高级使用技巧,无论是日常使用还是深度挖掘模型潜力,都能让你收获满满,快速成为 DeepSeek R1 使用高手。原创 2025-02-08 10:50:01 · 2727 阅读 · 0 评论 -
探秘 DeepSeek-R1:推理大语言模型的深度解析与启示
本文围绕推理大语言模型中的佼佼者 DeepSeek - R1 展开深度剖析。开篇阐述推理模型定义与应用场景,明确其在复杂任务中的优势。接着详细介绍 DeepSeek - R1 的训练流程,包括 R1 - Zero、R1 和 R1 - Distill 三种变体的训练差异。深入解读构建和改进推理模型的四种方法,对比分析其特性。同时探讨 DeepSeek - R1 与 o1 的性能差异、训练成本,并分享小成本训练推理模型的策略原创 2025-02-06 19:24:33 · 712 阅读 · 0 评论