
AI
文章平均质量分 93
若年封尘
这个作者很懒,什么都没留下…
展开
-
DeepSeek-R1论文解读,附15篇浙大、清华、北大、厦大宝典最全合集免费下载,建议收藏!
如表5所示,通过直接蒸馏DeepSeek-R1的输出,高效的小模型DeepSeek-R1-7B(即DeepSeek-R1-Distill-Qwen-7B,下文采用类似简称)即可全面超越GPT-4o-0513等非推理优化模型。值得注意的是,若对蒸馏模型施加强化学习(RL),性能可获进一步跃升。无需构建和维护高质量的 SFT 数据集,而是直接让模型在强化学习的环境中进行自我探索,通过与环境的互动,自主的去发现和学习解决复杂问题的能力,就好比一个初学者在没有老师的指导下通过不断的尝试和错误,来掌握一门新的技能。原创 2025-03-20 20:19:46 · 849 阅读 · 0 评论 -
OpenAI的真正对手?DeepSeek-R1如何用强化学习重构LLM能力边界——DeepSeek-R1论文精读
2025年1月20日,DeepSeek-R1 发布,并同步**开源**模型权重。截至目前,DeepSeek 发布的 iOS 应用甚至超越了 ChatGPT 的官方应用,直接登顶 AppStore。DeepSeek-R1 一经发布,各种资讯已经铺天盖地,那就让我们一起来精读一下论文,看看引爆AI圈的 DeepSeek-R1 是如何炼成的?原创 2025-01-27 17:39:33 · 2978 阅读 · 2 评论 -
2024年AI发展全景:塑造未来的技术趋势
现如今,AI正以前所未有的影响力重塑全球产业和社会发展的格局。它不仅仅是科技领域的一次革命,更被广泛认为是继电力革命之后的又一次重大飞跃,有人甚至将其比作“第二次地球文明革命”。AI的浪潮正席卷每一个角落,深刻地改变我们的工作和生活方式。它不仅是一种技术进步,更是推动整个人类文明向前发展的新动力。原创 2024-12-25 19:49:26 · 3193 阅读 · 0 评论 -
LLM时代下Embedding模型如何重塑检索、增强生成
Embedding模型作为RAG中检索召回的重要一环,扮演着极其关键的角色,直接影响到信息检索的效果和生成文本的质量。更加准确的Embedding模型在抑制模型幻觉、提升封闭领域回答能力等方面都能发挥优势。原创 2024-11-11 21:42:38 · 1445 阅读 · 0 评论