AI算法
文章平均质量分 96
AI算法类文章专栏
AIQL
https://github.com/AI-QL
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
vLLM V1 重磅升级:核心架构全面革新
2025年1月27日,vLLM 开发团队推出 vLLM V1 alpha 版本,这是对框架核心架构的里程碑式升级。基于过去一年半的开发经验沉淀,vLLM 开发团队重新审视关键设计决策,整合多样化功能模块,并通过代码重构大幅提升框架的灵活性和可扩展性。原创 2025-02-09 09:50:49 · 5389 阅读 · 0 评论 -
Deepseek的RL算法GRPO解读
GRPO通过优化PPO算法,移除了价值模型,降低了计算开销,同时利用群体相对优势函数和KL散度惩罚,确保策略更新既高效又稳定。原创 2025-01-28 19:33:53 · 7266 阅读 · 0 评论
分享