自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 收藏
  • 关注

原创 棋盘格标定图案与ArUco Markers

今天没有太多话说,提供两份代码,以及对应的图片给有需要的人,棋盘格是用来做相机畸变矫正的,ArUco是用来首先标定获取视觉位置的。

2025-10-24 10:06:43 335

原创 RV1126B板端部署YOLO8

序言:最近在做一个项目要求板端部署在RV1126B上,前期用python的部署,后期用C++部署。现在就来总结一下最近踩的的一些坑。

2025-10-12 10:11:59 1009

原创 抖音全新推荐大模型RankMixer

①特征提取embedding:将用户设置(用户画像),视频特征,序列特征,交互特征,等数百个特征进行embedding(词嵌入)。②Tokenization序列化:Automatic Feature Tokenization机制,将输入Token化为维度对齐的Token序列。③Token分组映射:基于业务先验知识按语义划分特征组,组内特征拼接后等距切分为固定维度的“Token”,每个Token代表一个语义一致的特征子空间,最后将切分后的向量统一映射到模型隐层维度。

2025-08-03 18:03:37 1690

原创 解决过拟合的思路方法

获取更多高质量标注数据(核心方法,但成本高)(低成本有效方案):旋转(±15°)、缩放(0.8-1.2倍)、平移(±10%)、翻转(水平/垂直):调整亮度(±20%)、对比度(0.8-1.5倍)、饱和度抖动、添加高斯噪声:Mixup(图像混合)、Cutout(随机遮挡)、CutMix(区域替换):减少网络层数、卷积通道数或全连接节点数:损失函数中添加权重绝对值之和(∑|w|),促进稀疏性:添加权重平方和(∑w²),约束权重幅度(更常用):AdamW优化器已内置L2正则训练时以概率p。

2025-08-02 00:30:52 493

原创 神经网络的基础

序言,本文讲解了一些神经网络的基础知识以及基本简单,卷积网络模块例如VGG,Resnet等等。

2025-08-01 23:59:42 507

原创 梯度下降的基本原理

序言:最近再整理之前的一些笔记,感觉梯度下降之前整理的很详细也很杂乱,删了也不是,留着看着也烦,就发到这里来当个备用吧。

2025-08-01 23:51:55 442

原创 YOLO V11 + BotSort行人追踪定位项目

基于yolo11+botsort的实时多目标追踪定位停留分析

2025-08-01 19:01:45 1496

原创 Agent智能会议室项目思路

当下有很多智能家具这种,但是大多数需要通过语音助手,去进行指令输入,然后根据指令去对特定的家具进行开关调节的操作。但是现在有多模态大模型的视频理解功能,就可以让这个过程变得更智能,不需要人工输入。能做到完全脱离人的智能,这里分享某个智能会议室的落地项目思路和部分代码,希望对正在研究相关项目的人有所帮助。

2025-07-31 10:14:52 381

原创 人脸检测识别总结+demo

本文主要介绍了deepface框架以及流程,包含可运行的代码demo,还有retinaFace,MobileFaceNet,以及人脸相关的数据集总结

2025-07-30 11:09:59 705

原创 AIGC文生图框架基础

Stable Diffusion的结构与原理与SD本地部署,SD提示词讲解

2025-07-25 16:34:08 860

原创 解决:conda环境造成的C盘爆满

最近项目很多造成我电脑C盘爆满,以至于跑项目的时候C盘内存只剩20G。最近项目都告一段落,也准备清理一下自己的conda环境。(清理完后恢复到了80G)1.首先先看看你的conda列表,删除那些年久不用的项目(这里可以释放很多,但是一定不要误删)2.清理所有无用安装包(这里也可以释放几十GB的内存)

2025-07-25 10:12:54 502

原创 基于deepseek的LORA微调

Lora微调原理与demo实操

2025-07-21 16:57:01 420

原创 deepseek大模型私有化部署(0基础,保姆级)

一文学会大模型部署基础,小白一小时速成部署自己的大模型。

2025-07-17 15:57:23 1140 1

原创 RT-DERT

RT-DETR:实时目标检测新范式 RT-DETR(Real-Time Detection Transformer)是CVPR2024提出的新型目标检测框架,通过将CNN与Transformer结合实现端到端检测,无需NMS后处理。其核心创新包括:1)混合编码器(Efficient Hybrid Encoder)进行多尺度特征融合;2)IoU感知查询选择机制提升定位精度;3)可变形注意力机制降低计算成本。该框架在YOLO生态中集成,支持HGNetV2/ResNet等主干网络,相比传统DETR显著提升实时性。

2025-07-16 13:39:14 1296

原创 VIT(视觉Transformer)

Vision Transformer (ViT) 将图像分割为16x16像素块作为视觉token,通过线性嵌入和位置编码处理后输入Transformer编码器。其核心思想是通过多头自注意力机制捕捉图像全局特征,但需要大量数据(4-10万张)才能有效训练。ViT具有长距离依赖的优势,但训练较慢且对patch划分敏感。文章提供了ViT的PyTorch实现代码,包括图像分块、位置编码、多头注意力和分类头等模块,并展示了完整的训练流程。该模型在足够数据量下能获得更精准的识别效果,但小数据场景建议先用CNN提取特征再

2025-07-11 21:51:40 723

原创 分割网络Segformer

一文读懂会用Segformer,包含Segformer的项目代码地址,Segformer论文地址,Segformer的demo测试。

2025-07-11 21:36:15 1500 1

原创 手撕transformer(代码)

手撕transformer,transformer结构,transformer代码,transformer面试相关问题

2025-06-25 20:28:51 788

原创 CMAKE

定义:在一个大的工程文件中,不同的文件按照功能被划分到不同的模块中,每个模块可能都会有自己的编译顺序和规则,如果在一个 Makefile 文件中描述所有模块的编译规则,就会很乱,执行时也会不方便,所以就需要在不同的模块中分别对它们的规则进行描述,也就是每一个模块都编写一个 Makefile 文件,这样不仅方便管理,而且可以迅速发现模块中的问题。当 -j 选项中没有出现数字的时候,使用默认的 job solts,值为 1,表示 make 将串行的执行规则的命令(同一时刻只能由一条命令被执行)。

2025-06-23 11:27:04 988

原创 Yolo v8详解(文字版)

YOLOv8目标检测框架解析:本文详细介绍了YOLOv8的网络架构与实现细节。相比YOLOv5,v8采用anchor-free设计和Task-Aligned Assigner动态样本分配机制。网络包含Backbone(CSPLayer2Conv+SPPF多尺度融合)、Neck(双向特征金字塔)和Head(解耦检测头)。训练阶段采用Mosaic4.0等数据增强,并通过动态加权评分(Metric(t)=S^α*u^β)分配正负样本,使用VFL、CIoU和DFL多任务损失。推理时对三个尺度(80×80、40×40

2025-06-20 15:32:36 1157

原创 YOLO v5详解(文字版)

最近在整理Yolo v5的流程,我发现网上写的大多很零碎,把推理过程和训练过程混淆。经过我长达三天的整理终于对照代码将Yolo v5详细训练过程,和Yolo v5详细训推理过程总结如下。如果有什么细节问题,根据本篇文章在询问ai。或者需要手写推理代码也可参考推理的后处理来进行参照。希望能帮到需要的人,如果有什么错误,也欢迎指正。(ps:由于不同版本的Yolo 5也有差别,请大家记得甄别仔细)

2025-06-18 17:11:08 1014

原创 android系统更新ActivityManager中APi问题解决

更新api

2024-04-23 14:18:36 540 2

原创 工作中的疑难杂症(编译ninja failed with: exit status 137)

ninja failed with: exit status 137问题

2023-12-07 15:23:36 2323

原创 Android开发从0开始(广播)

/进入画中画 } } } } } }//设置闹钟管理器(android6.0,后该方法,在灭屏不保证发送广播)Log.d("ning","接收器A收到一个有序广播");Log.d("ning","接收器B收到一个有序广播");{ Log.d("ning","收到闹钟广播");Log.d("ning","收到一个标准广播");Log.d("ning","进入画中画模式");Log.d("ning","退出画中画模式");Log.d("ning","震动");

2023-11-24 14:03:53 370

原创 Android开发从0开始(服务)

一个无限循环当中,然后每当发现MessageQueue中存在一条消息,就会将它取出,并传递到Handler的handleMessage()方法中。使用Handler 的sendMessage()方法, 而发出的消息经过一- 系列地辗转处理后,最终会传递到Handler的handleMessage()方法中。这部分消息会一直存在于消息队列中,等待被处理。是每个线程中的MessageQueue的管家,调用Looper的loop()方法后,就会进入到。顾名思义也就是处理者的意思,它主要是用于发送和处理消息的。

2023-11-24 14:01:14 489

原创 Android开发从0开始(ContentProvider与数据)

String desc = String.format("数据库%s创建%s", db.getPath(), (db!.setContentTitle("this is content title") //指定通知栏标题内容。.setContentText("this is content text")//指定通知栏正文内容。.setSmallIcon(R.mipmap.ic_launcher) //通知栏小图标。.setWhen(System.currentTimeMillis())//创建时间。

2023-11-24 11:11:15 458

原创 Android开发从0开始(Activity篇)

activity

2023-11-24 10:59:49 127

原创 工作中Git常用命令

git命令

2023-11-24 10:32:24 474

原创 工作中常用的ADB命令

adb命令

2023-11-24 10:30:33 132

原创 Android开发从0开始(图形与按钮)

Android组件,图形与按钮

2023-08-10 09:39:04 1836

原创 Android实现计算器

这个简易计算器还有很多bug例如,没有判断错误情况,三操作数情况,负数,科学计算器的功能等等,有待完善。(仅用于对前段时间知识的总结)。

2023-07-28 16:02:56 585

原创 Android开发从0开始(布局篇)

Android组件布局

2023-07-28 14:42:01 166

原创 C++冒泡排序

冒泡排序

2023-03-02 10:37:29 933

原创 C语言哈夫曼树

哈夫曼树

2023-03-02 10:02:31 462

原创 稀疏矩阵以及转置

稀疏矩阵的存储与转置

2022-11-19 23:59:40 505

原创 栈与队列(C语言)

栈,队列的初步理解

2022-11-19 23:45:14 262

原创 C语言猴子大王问题

C语言链表数据结构,解决猴子大王问题。

2022-11-15 23:46:41 1669

原创 C语言顺序查找

C语言数据结构的顺序查找,与折半查找

2022-11-14 23:55:34 2945

原创 C数据结构顺序表与基本操作

C语言,数据结构线性结构,顺序表的建立及其操作

2022-11-14 23:27:38 610

原创 C语言求顾客消费

0基础案例

2022-08-12 23:29:22 676 1

原创 C语言输出

C语言基础

2022-08-12 23:20:32 387

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除