小拇指～-优快云博客

原创棋盘格标定图案与ArUco Markers

今天没有太多话说，提供两份代码，以及对应的图片给有需要的人，棋盘格是用来做相机畸变矫正的，ArUco是用来首先标定获取视觉位置的。

2025-10-24 10:06:43 335

原创 RV1126B板端部署YOLO8

序言：最近在做一个项目要求板端部署在RV1126B上，前期用python的部署，后期用C++部署。现在就来总结一下最近踩的的一些坑。

2025-10-12 10:11:59 1009

①特征提取embedding：将用户设置(用户画像)，视频特征，序列特征，交互特征，等数百个特征进行embedding(词嵌入)。②Tokenization序列化：Automatic Feature Tokenization机制，将输入Token化为维度对齐的Token序列。③Token分组映射：基于业务先验知识按语义划分特征组，组内特征拼接后等距切分为固定维度的“Token”，每个Token代表一个语义一致的特征子空间，最后将切分后的向量统一映射到模型隐层维度。

2025-08-03 18:03:37 1690

原创解决过拟合的思路方法

获取更多高质量标注数据（核心方法，但成本高）（低成本有效方案）：旋转（±15°）、缩放（0.8-1.2倍）、平移（±10%）、翻转（水平/垂直）：调整亮度（±20%）、对比度（0.8-1.5倍）、饱和度抖动、添加高斯噪声：Mixup（图像混合）、Cutout（随机遮挡）、CutMix（区域替换）：减少网络层数、卷积通道数或全连接节点数：损失函数中添加权重绝对值之和（∑|w|），促进稀疏性：添加权重平方和（∑w²），约束权重幅度（更常用）：AdamW优化器已内置L2正则训练时以概率p。

2025-08-02 00:30:52 493

原创神经网络的基础

序言，本文讲解了一些神经网络的基础知识以及基本简单，卷积网络模块例如VGG，Resnet等等。

2025-08-01 23:59:42 507

原创梯度下降的基本原理

序言：最近再整理之前的一些笔记，感觉梯度下降之前整理的很详细也很杂乱，删了也不是，留着看着也烦，就发到这里来当个备用吧。

2025-08-01 23:51:55 442

原创 YOLO V11 + BotSort行人追踪定位项目

基于yolo11+botsort的实时多目标追踪定位停留分析

2025-08-01 19:01:45 1496

原创 Agent智能会议室项目思路

当下有很多智能家具这种，但是大多数需要通过语音助手，去进行指令输入，然后根据指令去对特定的家具进行开关调节的操作。但是现在有多模态大模型的视频理解功能，就可以让这个过程变得更智能，不需要人工输入。能做到完全脱离人的智能，这里分享某个智能会议室的落地项目思路和部分代码，希望对正在研究相关项目的人有所帮助。

2025-07-31 10:14:52 381

原创人脸检测识别总结+demo

本文主要介绍了deepface框架以及流程，包含可运行的代码demo，还有retinaFace，MobileFaceNet，以及人脸相关的数据集总结

2025-07-30 11:09:59 705

原创 AIGC文生图框架基础

Stable Diffusion的结构与原理与SD本地部署，SD提示词讲解

2025-07-25 16:34:08 860

原创解决:conda环境造成的C盘爆满

最近项目很多造成我电脑C盘爆满，以至于跑项目的时候C盘内存只剩20G。最近项目都告一段落，也准备清理一下自己的conda环境。(清理完后恢复到了80G)1.首先先看看你的conda列表，删除那些年久不用的项目(这里可以释放很多，但是一定不要误删)2.清理所有无用安装包（这里也可以释放几十GB的内存）

2025-07-25 10:12:54 502

原创基于deepseek的LORA微调

Lora微调原理与demo实操

2025-07-21 16:57:01 420

原创 deepseek大模型私有化部署(0基础，保姆级)

一文学会大模型部署基础，小白一小时速成部署自己的大模型。

2025-07-17 15:57:23 1140 1

原创 RT-DERT

RT-DETR：实时目标检测新范式 RT-DETR（Real-Time Detection Transformer）是CVPR2024提出的新型目标检测框架，通过将CNN与Transformer结合实现端到端检测，无需NMS后处理。其核心创新包括：1）混合编码器（Efficient Hybrid Encoder）进行多尺度特征融合；2）IoU感知查询选择机制提升定位精度；3）可变形注意力机制降低计算成本。该框架在YOLO生态中集成，支持HGNetV2/ResNet等主干网络，相比传统DETR显著提升实时性。

2025-07-16 13:39:14 1296

原创 VIT(视觉Transformer)

Vision Transformer (ViT) 将图像分割为16x16像素块作为视觉token，通过线性嵌入和位置编码处理后输入Transformer编码器。其核心思想是通过多头自注意力机制捕捉图像全局特征，但需要大量数据（4-10万张）才能有效训练。ViT具有长距离依赖的优势，但训练较慢且对patch划分敏感。文章提供了ViT的PyTorch实现代码，包括图像分块、位置编码、多头注意力和分类头等模块，并展示了完整的训练流程。该模型在足够数据量下能获得更精准的识别效果，但小数据场景建议先用CNN提取特征再

2025-07-11 21:51:40 723

原创分割网络Segformer

一文读懂会用Segformer，包含Segformer的项目代码地址，Segformer论文地址，Segformer的demo测试。

2025-07-11 21:36:15 1500 1

原创手撕transformer(代码)

手撕transformer，transformer结构，transformer代码，transformer面试相关问题

2025-06-25 20:28:51 788

原创 CMAKE

定义:在一个大的工程文件中，不同的文件按照功能被划分到不同的模块中，每个模块可能都会有自己的编译顺序和规则，如果在一个 Makefile 文件中描述所有模块的编译规则，就会很乱，执行时也会不方便，所以就需要在不同的模块中分别对它们的规则进行描述，也就是每一个模块都编写一个 Makefile 文件，这样不仅方便管理，而且可以迅速发现模块中的问题。当 -j 选项中没有出现数字的时候，使用默认的 job solts，值为 1，表示 make 将串行的执行规则的命令（同一时刻只能由一条命令被执行）。

2025-06-23 11:27:04 988

原创 Yolo v8详解(文字版)

YOLOv8目标检测框架解析：本文详细介绍了YOLOv8的网络架构与实现细节。相比YOLOv5，v8采用anchor-free设计和Task-Aligned Assigner动态样本分配机制。网络包含Backbone（CSPLayer2Conv+SPPF多尺度融合）、Neck（双向特征金字塔）和Head（解耦检测头）。训练阶段采用Mosaic4.0等数据增强，并通过动态加权评分（Metric(t)=S^α*u^β）分配正负样本，使用VFL、CIoU和DFL多任务损失。推理时对三个尺度（80×80、40×40

2025-06-20 15:32:36 1157

原创 YOLO v5详解(文字版)

最近在整理Yolo v5的流程，我发现网上写的大多很零碎，把推理过程和训练过程混淆。经过我长达三天的整理终于对照代码将Yolo v5详细训练过程，和Yolo v5详细训推理过程总结如下。如果有什么细节问题，根据本篇文章在询问ai。或者需要手写推理代码也可参考推理的后处理来进行参照。希望能帮到需要的人，如果有什么错误，也欢迎指正。（ps:由于不同版本的Yolo 5也有差别，请大家记得甄别仔细）

2025-06-18 17:11:08 1014

原创 android系统更新ActivityManager中APi问题解决

更新api

2024-04-23 14:18:36 540 2

原创工作中的疑难杂症（编译ninja failed with: exit status 137）

ninja failed with: exit status 137问题

2023-12-07 15:23:36 2323

原创 Android开发从0开始（广播）

/进入画中画 } } } } } }//设置闹钟管理器（android6.0,后该方法，在灭屏不保证发送广播）Log.d("ning","接收器A收到一个有序广播");Log.d("ning","接收器B收到一个有序广播");{ Log.d("ning","收到闹钟广播");Log.d("ning","收到一个标准广播");Log.d("ning","进入画中画模式");Log.d("ning","退出画中画模式");Log.d("ning","震动");

2023-11-24 14:03:53 370

原创 Android开发从0开始（服务）

一个无限循环当中，然后每当发现MessageQueue中存在一条消息，就会将它取出，并传递到Handler的handleMessage()方法中。使用Handler 的sendMessage()方法，而发出的消息经过一- 系列地辗转处理后，最终会传递到Handler的handleMessage()方法中。这部分消息会一直存在于消息队列中，等待被处理。是每个线程中的MessageQueue的管家，调用Looper的loop()方法后，就会进入到。顾名思义也就是处理者的意思，它主要是用于发送和处理消息的。

2023-11-24 14:01:14 489

原创 Android开发从0开始（ContentProvider与数据）

String desc = String.format("数据库%s创建%s", db.getPath(), (db!.setContentTitle("this is content title") //指定通知栏标题内容。.setContentText("this is content text")//指定通知栏正文内容。.setSmallIcon(R.mipmap.ic_launcher) //通知栏小图标。.setWhen(System.currentTimeMillis())//创建时间。

2023-11-24 11:11:15 458

空空如也

空空如也