- 博客(54)
- 收藏
- 关注
原创 棋盘格标定图案与ArUco Markers
今天没有太多话说,提供两份代码,以及对应的图片给有需要的人,棋盘格是用来做相机畸变矫正的,ArUco是用来首先标定获取视觉位置的。
2025-10-24 10:06:43
335
原创 RV1126B板端部署YOLO8
序言:最近在做一个项目要求板端部署在RV1126B上,前期用python的部署,后期用C++部署。现在就来总结一下最近踩的的一些坑。
2025-10-12 10:11:59
1009
原创 抖音全新推荐大模型RankMixer
①特征提取embedding:将用户设置(用户画像),视频特征,序列特征,交互特征,等数百个特征进行embedding(词嵌入)。②Tokenization序列化:Automatic Feature Tokenization机制,将输入Token化为维度对齐的Token序列。③Token分组映射:基于业务先验知识按语义划分特征组,组内特征拼接后等距切分为固定维度的“Token”,每个Token代表一个语义一致的特征子空间,最后将切分后的向量统一映射到模型隐层维度。
2025-08-03 18:03:37
1690
原创 解决过拟合的思路方法
获取更多高质量标注数据(核心方法,但成本高)(低成本有效方案):旋转(±15°)、缩放(0.8-1.2倍)、平移(±10%)、翻转(水平/垂直):调整亮度(±20%)、对比度(0.8-1.5倍)、饱和度抖动、添加高斯噪声:Mixup(图像混合)、Cutout(随机遮挡)、CutMix(区域替换):减少网络层数、卷积通道数或全连接节点数:损失函数中添加权重绝对值之和(∑|w|),促进稀疏性:添加权重平方和(∑w²),约束权重幅度(更常用):AdamW优化器已内置L2正则训练时以概率p。
2025-08-02 00:30:52
493
原创 Agent智能会议室项目思路
当下有很多智能家具这种,但是大多数需要通过语音助手,去进行指令输入,然后根据指令去对特定的家具进行开关调节的操作。但是现在有多模态大模型的视频理解功能,就可以让这个过程变得更智能,不需要人工输入。能做到完全脱离人的智能,这里分享某个智能会议室的落地项目思路和部分代码,希望对正在研究相关项目的人有所帮助。
2025-07-31 10:14:52
381
原创 人脸检测识别总结+demo
本文主要介绍了deepface框架以及流程,包含可运行的代码demo,还有retinaFace,MobileFaceNet,以及人脸相关的数据集总结
2025-07-30 11:09:59
705
原创 解决:conda环境造成的C盘爆满
最近项目很多造成我电脑C盘爆满,以至于跑项目的时候C盘内存只剩20G。最近项目都告一段落,也准备清理一下自己的conda环境。(清理完后恢复到了80G)1.首先先看看你的conda列表,删除那些年久不用的项目(这里可以释放很多,但是一定不要误删)2.清理所有无用安装包(这里也可以释放几十GB的内存)
2025-07-25 10:12:54
502
原创 RT-DERT
RT-DETR:实时目标检测新范式 RT-DETR(Real-Time Detection Transformer)是CVPR2024提出的新型目标检测框架,通过将CNN与Transformer结合实现端到端检测,无需NMS后处理。其核心创新包括:1)混合编码器(Efficient Hybrid Encoder)进行多尺度特征融合;2)IoU感知查询选择机制提升定位精度;3)可变形注意力机制降低计算成本。该框架在YOLO生态中集成,支持HGNetV2/ResNet等主干网络,相比传统DETR显著提升实时性。
2025-07-16 13:39:14
1296
原创 VIT(视觉Transformer)
Vision Transformer (ViT) 将图像分割为16x16像素块作为视觉token,通过线性嵌入和位置编码处理后输入Transformer编码器。其核心思想是通过多头自注意力机制捕捉图像全局特征,但需要大量数据(4-10万张)才能有效训练。ViT具有长距离依赖的优势,但训练较慢且对patch划分敏感。文章提供了ViT的PyTorch实现代码,包括图像分块、位置编码、多头注意力和分类头等模块,并展示了完整的训练流程。该模型在足够数据量下能获得更精准的识别效果,但小数据场景建议先用CNN提取特征再
2025-07-11 21:51:40
723
原创 分割网络Segformer
一文读懂会用Segformer,包含Segformer的项目代码地址,Segformer论文地址,Segformer的demo测试。
2025-07-11 21:36:15
1500
1
原创 手撕transformer(代码)
手撕transformer,transformer结构,transformer代码,transformer面试相关问题
2025-06-25 20:28:51
788
原创 CMAKE
定义:在一个大的工程文件中,不同的文件按照功能被划分到不同的模块中,每个模块可能都会有自己的编译顺序和规则,如果在一个 Makefile 文件中描述所有模块的编译规则,就会很乱,执行时也会不方便,所以就需要在不同的模块中分别对它们的规则进行描述,也就是每一个模块都编写一个 Makefile 文件,这样不仅方便管理,而且可以迅速发现模块中的问题。当 -j 选项中没有出现数字的时候,使用默认的 job solts,值为 1,表示 make 将串行的执行规则的命令(同一时刻只能由一条命令被执行)。
2025-06-23 11:27:04
988
原创 Yolo v8详解(文字版)
YOLOv8目标检测框架解析:本文详细介绍了YOLOv8的网络架构与实现细节。相比YOLOv5,v8采用anchor-free设计和Task-Aligned Assigner动态样本分配机制。网络包含Backbone(CSPLayer2Conv+SPPF多尺度融合)、Neck(双向特征金字塔)和Head(解耦检测头)。训练阶段采用Mosaic4.0等数据增强,并通过动态加权评分(Metric(t)=S^α*u^β)分配正负样本,使用VFL、CIoU和DFL多任务损失。推理时对三个尺度(80×80、40×40
2025-06-20 15:32:36
1157
原创 YOLO v5详解(文字版)
最近在整理Yolo v5的流程,我发现网上写的大多很零碎,把推理过程和训练过程混淆。经过我长达三天的整理终于对照代码将Yolo v5详细训练过程,和Yolo v5详细训推理过程总结如下。如果有什么细节问题,根据本篇文章在询问ai。或者需要手写推理代码也可参考推理的后处理来进行参照。希望能帮到需要的人,如果有什么错误,也欢迎指正。(ps:由于不同版本的Yolo 5也有差别,请大家记得甄别仔细)
2025-06-18 17:11:08
1014
原创 工作中的疑难杂症(编译ninja failed with: exit status 137)
ninja failed with: exit status 137问题
2023-12-07 15:23:36
2323
原创 Android开发从0开始(广播)
/进入画中画 } } } } } }//设置闹钟管理器(android6.0,后该方法,在灭屏不保证发送广播)Log.d("ning","接收器A收到一个有序广播");Log.d("ning","接收器B收到一个有序广播");{ Log.d("ning","收到闹钟广播");Log.d("ning","收到一个标准广播");Log.d("ning","进入画中画模式");Log.d("ning","退出画中画模式");Log.d("ning","震动");
2023-11-24 14:03:53
370
原创 Android开发从0开始(服务)
一个无限循环当中,然后每当发现MessageQueue中存在一条消息,就会将它取出,并传递到Handler的handleMessage()方法中。使用Handler 的sendMessage()方法, 而发出的消息经过一- 系列地辗转处理后,最终会传递到Handler的handleMessage()方法中。这部分消息会一直存在于消息队列中,等待被处理。是每个线程中的MessageQueue的管家,调用Looper的loop()方法后,就会进入到。顾名思义也就是处理者的意思,它主要是用于发送和处理消息的。
2023-11-24 14:01:14
489
原创 Android开发从0开始(ContentProvider与数据)
String desc = String.format("数据库%s创建%s", db.getPath(), (db!.setContentTitle("this is content title") //指定通知栏标题内容。.setContentText("this is content text")//指定通知栏正文内容。.setSmallIcon(R.mipmap.ic_launcher) //通知栏小图标。.setWhen(System.currentTimeMillis())//创建时间。
2023-11-24 11:11:15
458
原创 Android实现计算器
这个简易计算器还有很多bug例如,没有判断错误情况,三操作数情况,负数,科学计算器的功能等等,有待完善。(仅用于对前段时间知识的总结)。
2023-07-28 16:02:56
585
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅