人工智能
文章平均质量分 88
西瓜和拾月
家有西瓜猫
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Transformer 2】ViT 论文学习笔记+训练微调
本文介绍了Vision Transformer(ViT)的模型结构、实现细节及实践应用。首先分析了ViT的核心思想:将图像切割为patch序列,通过线性投影转换为token后加入位置编码,经Transformer Encoder处理后进行分类预测。文章结合PyTorch代码详细解析了图像嵌入、位置编码、多头注意力机制等关键模块的实现。在实践部分,展示了如何构建自定义数据集训练ViT模型,并对比了直接训练和预训练微调的效果差异。研究表明,ViT虽然缺乏CNN的归纳偏置特性,需要大量训练数据支持,但其创新性地将原创 2025-09-30 17:58:00 · 185 阅读 · 0 评论 -
【Transformer 1】Attention Is All You Need 学习笔记
Transformer 学习笔记原创 2025-09-09 08:08:35 · 1146 阅读 · 0 评论 -
【模型剪枝2】不同剪枝方法实现对 yolov5n 剪枝测试及对比
本文对比测试了三种剪枝方法在 YOLOv5n6 模型上的应用效果。通过对比验证了不同剪枝方法的优劣,为进一步研究模型优化(如结合量化、蒸馏等方法)奠定了基础。原创 2025-08-12 21:02:40 · 1083 阅读 · 0 评论 -
【模型剪枝1】结构化剪枝论文学习笔记
本文探讨了深度学习模型剪枝技术,重点分析了三篇关于结构化剪枝的论文。这些方法相比非结构化剪枝更易于硬件加速,并能通过微调恢复精度。文章指出,结构化剪枝在模型优化中具有灵活性高、实现简单等优势,但需要针对不同网络结构设计特定策略。原创 2025-07-25 16:46:20 · 942 阅读 · 0 评论 -
【图像超分重建】Real-ESRGAN 本地推理测试及量化部署
经过一番折腾实现了 Real-ESRGAN 的边端推理,过程比预想的顺利,最终的效果和速度(能力有限,目前只能做到这个速度)基本满足需求。除了 Real-ESRGAN,也测试了EGVSR和CAMixerSR,都是主打速度快。原创 2025-05-07 20:50:04 · 2366 阅读 · 3 评论 -
【图像分割】不安装ultralytics库实现yolov8-seg训练自定义数据集
记录了一次不使用ultralytics库实现yolov8训练的折腾过程。原创 2024-12-09 15:04:33 · 1481 阅读 · 0 评论 -
【标注工具】Ubuntu20.04 下 CVAT 的安装及使用教程
CVAT本地部署及使用教程原创 2024-10-24 13:30:25 · 9649 阅读 · 6 评论 -
【关键点检测】yolov7-pose改造——任意数量关键点检测并训练自己的数据集
yolov7-pose改造原创 2024-07-16 16:07:39 · 5273 阅读 · 23 评论 -
【标注工具】labelme5.0.1自定义功能——添加水平线标注及显示信息
labelme自定义功能改写原创 2024-07-10 15:40:08 · 2773 阅读 · 6 评论 -
【图像生成2】本地部署 LDM 并训练自己的数据集
总体来看 LDM 的使用不算复杂,而且生成效果还不错。在使用 LDM 之前试过DDPM,训练时间太长,生成效果不如 LDM。因为目前只需要无条件生成,对于有条件生成没有测试过,后面如果用到了再具体研究吧。原创 2025-05-25 12:29:13 · 1666 阅读 · 4 评论 -
【图像生成1】Latent Diffusion Models 论文学习笔记
Latent Diffusion Models 论文笔记原创 2025-05-16 18:31:16 · 1657 阅读 · 0 评论
分享