自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 【Transform 2】ViT 论文学习笔记+训练微调

本文介绍了Vision Transformer(ViT)的模型结构、实现细节及实践应用。首先分析了ViT的核心思想:将图像切割为patch序列,通过线性投影转换为token后加入位置编码,经Transformer Encoder处理后进行分类预测。文章结合PyTorch代码详细解析了图像嵌入、位置编码、多头注意力机制等关键模块的实现。在实践部分,展示了如何构建自定义数据集训练ViT模型,并对比了直接训练和预训练微调的效果差异。研究表明,ViT虽然缺乏CNN的归纳偏置特性,需要大量训练数据支持,但其创新性地将

2025-09-30 17:58:00 162

原创 【Transformer 1】Attention Is All You Need 学习笔记

Transformer 学习笔记

2025-09-09 08:08:35 1128

原创 【模型剪枝2】不同剪枝方法实现对 yolov5n 剪枝测试及对比

本文对比测试了三种剪枝方法在 YOLOv5n6 模型上的应用效果。通过对比验证了不同剪枝方法的优劣,为进一步研究模型优化(如结合量化、蒸馏等方法)奠定了基础。

2025-08-12 21:02:40 1035

原创 【模型剪枝1】结构化剪枝论文学习笔记

本文探讨了深度学习模型剪枝技术,重点分析了三篇关于结构化剪枝的论文。这些方法相比非结构化剪枝更易于硬件加速,并能通过微调恢复精度。文章指出,结构化剪枝在模型优化中具有灵活性高、实现简单等优势,但需要针对不同网络结构设计特定策略。

2025-07-25 16:46:20 867

原创 【备忘录】Ubuntu 配置虚拟显示器

使用此方式后系统以虚拟显示器方式显示,即使连接显示器也是黑屏,如果不想使用了删除 xorg.conf 文件重启即可。使用虚拟显示器解决断开显示器连接后 Ubuntu 远控失效的问题。安装 Xorg 虚拟驱动。

2025-07-21 13:55:49 394

原创 【备忘录】Ubuntu 配置 NFS

【代码】【备忘录】Ubuntu 配置 NFS。

2025-07-21 11:02:39 273

原创 【图像生成2】本地部署 LDM 并训练自己的数据集

总体来看 LDM 的使用不算复杂,而且生成效果还不错。在使用 LDM 之前试过DDPM,训练时间太长,生成效果不如 LDM。因为目前只需要无条件生成,对于有条件生成没有测试过,后面如果用到了再具体研究吧。

2025-05-25 12:29:13 1525 4

原创 【图像生成1】Latent Diffusion Models 论文学习笔记

Latent Diffusion Models 论文笔记

2025-05-16 18:31:16 1598

原创 【Python】pyinstaller 反编译 exe

折腾了大半天好歹是拿到需要的源码了,经过这次教训,以后还是及时备份文件吧。

2025-05-08 17:46:43 1658

原创 【图像超分重建】Real-ESRGAN 本地推理测试及量化部署

经过一番折腾实现了 Real-ESRGAN 的边端推理,过程比预想的顺利,最终的效果和速度(能力有限,目前只能做到这个速度)基本满足需求。除了 Real-ESRGAN,也测试了EGVSR和CAMixerSR,都是主打速度快。

2025-05-07 20:50:04 2174 3

原创 【Linux】编译安装 opencv 并链接到 VSCode

本文主要记录一下如何编译安装opencv并用VSCode调用,主要的坑还是在编译部分,如果编译没有问题后面就比较顺了。

2025-05-07 20:42:35 1539 4

原创 【备忘录】Linux 下查看磁盘占用

查看当前路径下各个文件夹大小。

2025-02-13 13:45:01 150

原创 【音视频】使用 GStreamer 管道和 opencv 读取摄像头并实现自定义码率视频录制

使用GStreamer管道实现自定义码率视频录制

2025-01-10 17:17:54 3121 1

原创 【Linux】RK3588编译安装 GStreamer 支持的 opencv-python

记录如何编译安装 GStreamer 支持的 opencv-python

2024-12-31 14:50:03 2282

原创 【Linux】Ubuntu20.04不安装Anaconda实现创建并配置python虚拟环境

本文是在调一个文件加载 bug 过程中偶然产生的,虽然这个方法并没有解决那个 bug,但这也是第一次用,就想着还是记录一下吧,万一哪天再用到也方便参考。调了一天的bug最终居然是因为文件版本(x86-64)不对,一直提示 No such File,换了 arm64的就好了......

2024-12-18 13:33:05 1191

原创 【图像分割】不安装ultralytics库实现yolov8-seg训练自定义数据集

记录了一次不使用ultralytics库实现yolov8训练的折腾过程。

2024-12-09 15:04:33 1449

原创 【备忘录】pip 报错:Could not install packages due to an OSError: Missing dependencies for SOCKS support

【代码】【备忘录】pip 报错:Could not install packages due to an OSError: Missing dependencies for SOCKS support。

2024-11-27 15:51:59 400

原创 【标注工具】Ubuntu20.04 下 CVAT 的安装及使用教程

CVAT本地部署及使用教程

2024-10-24 13:30:25 9225 5

原创 【边缘计算】YOLO模型量化及其在RK3588边缘盒子(ARM64)上的部署

从模型转换到RK3588模型部署工作流程

2024-09-25 14:47:44 7610 3

原创 【图像处理】基于传统图像处理的圆环检测及宽度估算

图像处理检测圆环

2024-08-05 13:08:25 424

原创 【关键点检测】yolov7-pose改造——任意数量关键点检测并训练自己的数据集

yolov7-pose改造

2024-07-16 16:07:39 5150 24

原创 【标注工具】labelme5.0.1自定义功能——添加水平线标注及显示信息

labelme自定义功能改写

2024-07-10 15:40:08 2713 6

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除