自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 多头潜在注意力(MLA)原理

MLA是一种改进的注意力机制,旨在提高自然语言处理(NLP)模型的推理效率和性能。它通过低秩联合压缩键(Key)和值(Value),减少推理过程中所需的内存和计算资源,从而实现更高效的处理。

2025-03-19 12:32:51 810

原创 PyTorch深度学习第三章学习笔记

关于PyTorch深度学习。

2025-01-21 21:22:29 1447

原创 PyTorch深度学习第二章学习笔记

关于PyTorch深度学习笔记。

2025-01-21 21:21:00 1627

原创 PyTorch深度学习第一章学习笔记

过去10年,被称为机器学习的一类系统重度依赖于特征工程。特征是对输入数据的转换,它有助于下游算法(如分类器)在新数据上产生真确的结果。特征工程包括提出正确的转换,它有助于下游算法完成任务。为了在手写数字的图像中区分0和1,可以利用一组滤波器来判断图像边缘方向,训练一个分类器,在给定边缘方向分布的情况下预测正确的数字。深度学习实现的是从原始数据中自动找到这样的表征,以便成功执行任务。在区分1和0的例子中,滤波器会在训练中通过迭代地查看成对的例子和目标标签来改进。

2025-01-16 22:03:45 1471

原创 Unix学习笔记

Unix系统的学习与命令总结,可用来查询忘记的命令。

2025-01-15 21:43:22 551

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除