为了更好地整理文章和发表接下来的文章,以后每周都汇总一份周报。
机器学习实验室 | 制作个人的第一个RAG demo!-优快云博客
天才程序员周弈帆 | 从零理解熵、交叉熵、KL散度-优快云博客
Zilliz | 别搞Graph RAG了,拥抱新一代RAG范式DeepSearcher-优快云博客
天才程序员周弈帆 | 扩散模型(Diffusion Model)详解:直观理解、数学原理、PyTorch 实现(上)-优快云博客
天才程序员周弈帆 | 扩散模型(Diffusion Model)详解:直观理解、数学原理、PyTorch 实现(下)-优快云博客
江大白 | CVPR2025,英伟达提出首个Mamba-Transformer视觉骨干网络!(附论文和源码)-优快云博客
Zilliz | 通义QwQ-32B+Milvus,消费级显卡布满血大模型与RAG的时代来了!-优快云博客
数据派THU | 用PyTorch从零构建 DeepSeek R1:模型架构和分步训练详解(上)-优快云博客
数据派THU | 用PyTorch从零构建 DeepSeek R1:模型架构和分步训练详解(下)-优快云博客
量子位 | 何恺明LeCun联手改造Transformer!9行代码替代归一化层,性能不减还加速-优快云博客
python | Python模块缓存:sys.modules机制-优快云博客
数据派THU | MOIRAI-MOE: 基于混合专家系统的大规模时间序列预测模型-优快云博客
GiantPandaLLM | 非常简洁的图像复原新方法:退化分类预训练,已中ICLR2025-优快云博客
好的文章值得反复学习!
THE END!
文章结束,感谢阅读。您的点赞,收藏,评论是我继续更新的动力。大家有推荐的公众号可以评论区留言,共同学习,一起进步。