大语言模型
文章平均质量分 94
空 白II
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Qwen2.5 Technical Report 论文进阶学习总结
这里我们接着上一次对 《Qwen2.5 Technical Report》 文章的内容总结,将文章中笔者学习到的论文重要概念,以及单词、短语、用法总结原创 2025-04-09 06:00:00 · 1721 阅读 · 0 评论 -
Transformer与注意力机制详解
本文直观上详细介绍了大语言模型中十分重要的结构——Transformer,及其核心:注意力机制的原理。原创 2025-04-05 20:45:09 · 974 阅读 · 0 评论 -
基于 python 的语音大模型交互
本文章是使用 python 调用语音输入设备、飞桨语音识别和 Qwen 大模型进行云、边、端语音大模型交互原创 2025-04-06 08:00:00 · 1177 阅读 · 0 评论 -
Qwen2.5 Technical Report 文章内容总结
总结了 QWen2.5 论文原文,对每个部分的内容进行了精细解读,并给出了每个部分的文章结构总结原创 2025-04-06 06:00:00 · 974 阅读 · 0 评论 -
大模型微调方法之Delta-tuning
大模型微调方法自从23年之后可谓是百花齐放,浙大有团队在8月将关于大模型微调方法的综述上传了ArXiv。论文将微调方法总结为等几个类别。本次讨论的原创 2025-03-24 09:00:00 · 853 阅读 · 0 评论
分享