- 博客(334)
- 资源 (8)
- 收藏
- 关注

原创 大语言模型开源数据集
本文目标:汇聚目前大语言模型预训练、微调、RM/RL、评测等全流程所需的常见数据集,方便大家使用,本文持续更新。文章较长,建议收藏后使用。
2024-04-09 15:32:25
3289
1
原创 深入理解Agentic Workflows
这篇文章将带你深入理解AI Agent、Agentic AI、Agentic Workflows、Agentic Architectures等概念,非常值得推荐。
2025-03-29 19:20:30
1022
原创 2025年全球生成式AI消费应用发展趋势报告
AI应用正从概念验证转向规模化落地,头部玩家通过持续技术创新巩固优势,垂直领域呈现突破性进展,AI视频生成工具实现高质量可控内容生产,开发者工具重构软件开发范式。
2025-03-08 19:37:16
987
原创 通俗理解Test time Scaling Law、RL Scaling Law和预训练Scaling Law
Test time Scaling Law、RL Scaling Law和预训练Scaling Law,三者形成循环迭代。
2025-02-23 00:37:56
1620
原创 全面对比DeepSeek-V3模型、R1模型和R1-Zero模型
V3:适合企业级大规模NLP需求,追求效率与成本平衡。R1:推荐学术研究、复杂问题解决场景,需深度推理与结构化输出。R1-Zero:适用于探索RL技术边界或需自我优化能力的实验场景。
2025-02-06 14:32:57
9058
1
原创 DeepSeek用到的GRPO算法究竟是什么?
GRPO 是一种用于训练大语言模型(比如 ChatGPT 这类 AI)的强化学习算法。它的核心目标是通过“组内比较”的方式,让模型学会生成更优秀的回答,而无需依赖复杂的额外模型来评判好坏。
2025-02-06 14:08:29
730
原创 2025年AI产品趋势预测:AI数字分身、万物皆可玩、AI搜索3.0、3D人机交互
2025年必将将迎来AI用户产品的大规模爆发,AI数字分身、创新玩法、AI搜索3.0以及3D人机交互这4个方向将成为AI产品的破局点。
2024-12-06 18:00:17
965
原创 AI Agent:人人都是开发者
Agent提供的快速迭代和实验本身就是一种新的用户体验发明路径。因此,Agent的价值在于降低新产品的开发成本,缩短开发周期,快速验证想法,通过组合式创新发现商业机会。
2024-11-27 18:35:11
868
原创 大模型应用在于组合式创新
大模型的能力越来越像是哆啦A梦的百宝箱,应用尽有,无所不能,怎么让这些AI能力在日常生活的场景中决解实际问题,这是当前大模型产品落地的痛点。大模型产品的成功,最终将取决于如何以“组合”的方式实现技术的最大化价值。
2024-11-22 15:17:53
451
改变未来的九大算法
2016-05-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人