__NONO__-优快云博客

原创 Zero-Shot TrackingT0：对象分割+运动感知记——当“切万物”武士学会运动记忆，目标跟踪稳如老狗

本文提出了一种改进的目标跟踪算法，通过运动建模和动态记忆库优化了原SAMv2框架的缺陷。核心创新包括：1）基于卡尔曼滤波的双路径决策机制，融合运动与外观特征；2）动态阈值记忆库，有效抑制遮挡干扰。实验表明，该算法在目标跟踪准确性和稳定性上显著提升，尤其适用于复杂场景（如自动驾驶、工业检测）。该框架无需微调即可实现即插即用，具备良好的实时性和泛化能力，未来可扩展至3D跟踪和移动端应用。

2025-07-25 22:22:34 846

原创突破小样本瓶颈：DataDream——用Stable Diffusion生成高质量分类数据集

DataDream提出了一种创新的小样本引导合成数据生成框架，通过LoRA微调Stable Diffusion模型解决传统方法的语义歧义和细节缺失问题。该方法采用动态提示和双模式适配策略，在10个数据集上取得7项SOTA性能，其中Stanford Cars数据集上纯合成数据训练准确率达92.2%。实验显示其生成图像质量显著优于FakeIt和DISEF等方法，能准确捕捉细粒度特征。技术方案包含完整的部署流程，从模型下载、数据准备到微调训练和图像生成，为小样本学习提供了高效的数据增强解决方案。

2025-07-09 17:46:23 1406

原创 Magic Tokens: Select Diverse Tokens for Multi-modal Object Re-Identification

单模态对象重识别（ReID）在复杂视觉场景中保持鲁棒性方面面临着巨大挑战。相比之下，多模态对象ReID利用来自不同模态的互补信息，显示出实际应用的巨大潜力。然而，以前的方法可能容易受到不相关背景的影响，并且通常忽略模态差距。为了解决上述问题，研究团队提出了一种名为EDITOR的新型学习框架，用于从视觉变换器中选择多样化的标记以进行多模态对象ReID。研究团队首先使用共享的视觉变换器提取来自不同输入模态的标记化特征。然后，研究团队引入空间-频率标记选择（SFTS）模块，自适应地选择具有空间和频率信息的以对象

2025-01-24 15:51:47 973

原创通过多模态特征选择提升对象重识别的性能：EDITOR框架的探索

EDITOR框架结合了空间-频率标记选择（SFTS）和分层掩蔽聚合（HMA），有效地选择和聚合多模态特征。为了减少背景对重识别性能的影响，框架还引入了背景一致性约束（BCC）和以对象为中心的特征精炼（OCFR）损失。这些创新的设计使得EDITOR在处理复杂的多模态数据时更为表现出色。

2025-01-22 11:10:24 542

原创从零开始用Docker构建自己的项目环境

创建一个目录用于存储Docker镜像和其他相关文件。这里我用的是自己虚拟机中某个项目的环境打包的镜像。如果已安装会出现如👇。

2025-01-20 15:03:02 463

原创从分割到匹配：MASA (Matching Anything by Segmenting Anything)

MASA(Matching Anything By Segmenting Anything)提供了一个通用的实例外观模型，用于匹配任何领域中的任何对象。在复杂场景中，对相同物体的跨帧关联相当重要，尤其是多目标跟踪，而在此之前的方法主要依赖于特定领域的标记数据集，导致模型在面对不同类型的视频或场景时，无法有效地进行物体识别和跟踪。而作者提出的MASA是一种用于稳健实例关联学习的新方法，能够跨不同域匹配视频中的任何对象，而无需跟踪标签。

2025-01-09 15:27:59 755

原创基于YOLOv9训练自己的数据集

并cd到torch和torchvision的下载目录并通过pip install 下载。这里的yaml文件和路径等需要根据自己的数据集进行修改。打开setting设置自己的虚拟环境。将压缩包放到自己的目标目录解压。配置虚拟环境的工程依赖。

2024-02-26 23:56:45 1470

原创一个简单的后端程序

项目包括一个客户端和一个服务端，界面将简单布置几个文本框和按钮，主要方便演示测试。最后Finish就完成了。

2024-02-17 23:26:24 898

原创瑞芯微3588系统重装

进入tools打开RKDevTool.exe，可以看到下面显示发现Loader设备，然后按照下面的步骤进行固件烧录。点击固件将对应路径的固件，等待固件加载然后“升级"，等待升级完成就可以重启了。下载 Release_DriverAssistant.zip，解压，然后运行里面的 DriverInstall.exe。为了所有设备都使用更新的驱动，请先选择驱动卸载，然后再选择驱动安装。断电长按开发板的recover键三秒，不松开进行上电然后再松开recover，条件：USB数据线、Ubuntu固件(

2024-02-15 10:48:04 3622

原创一些常用的工具资料记录

特征提取和描述：包括提取和描述图像中的特征点、计算特征描述子等。STB Vorbis：用于解码Ogg Vorbis音频文件的库。STB Truetype：用于渲染TrueType字体的库。三维重建：包括从多个图像中恢复三维场景的结构和深度信息等。物体检测和跟踪：包括人脸检测、行人检测、运动目标跟踪等。STB Image：用于加载和保存各种图像格式的库。STB Rect Pack：用于矩形打包算法的库。图像处理：包括图像滤波、边缘检测、图像变换等。STB DXT：用于压缩和解压DXT纹理的库。

2023-12-01 12:13:41 343

原创 Code::Blocks 安装、配置opencv

将下载的文件放入目录然后在codeblocks中开始配置：路径输入刚才下载解压后的路径，注意保持下面几个可执行文件的路径正确。除了选择安装路径以外，一路默认就好，然后codeblocks就安装好了。接着开始装编译器（为什么没有一起安装下载呢。因为网太差根本下不下来）

2023-11-30 15:14:24 433

原创 Windows下载安装Opencv并在visual studio配置

C/C++——添加 OpenCV 的头文件路径。选择安装路径，然后Extract。

2023-11-30 14:09:08 317

原创 Windows下Visual Studio安装部署Tensorflow开始写一个简单的小网络

在“C/C++”选项卡中，将“预处理器”设置为“_CRT_SECURE_NO_WARNINGS”，以避免由于使用不安全的函数而导致的编译器警告。在“链接器”选项卡中，将“附加依赖项”设置为“tensorflow.lib”。这将告诉链接器链接TensorFlow C库。在“链接器”选项卡中，在右侧面板的“常规”下拉菜单中，选择“附加库目录”，添加TensorFlow C库的库文件路径。在“VC++目录”选项卡中，将TensorFlow C库的头文件路径添加到“包含目录”列表中。这里我下的是cpu版，

2023-11-29 17:03:42 2219

原创数据结构学习记录——主要术语、概念

20.二叉查找树(binary search tree)：也称为排序二叉树，是一棵空树或具有以下性质的二叉树：①若左子树不为空，则左子树上所有结点的值均小于它的根节点的值；19.平衡二叉树(balance binary tree)：是一种特殊的二叉树，它是一棵空树或者它的左右两颗子树的高度差的绝对值不超过1，并且左右两个子树都是一棵平衡二叉树。12.栈(stack)：是一种特殊的线性表，只能在表的一端进行插入和删除操作，被插入的新元素必须放在当前栈顶元素之前，而删除的元素则是当前栈顶元素。

2023-11-25 16:53:19 137

原创 YOLOV7下训练自己的数据集

在目录表中可以看到，有一个requirements.txt，里面包含了yolov7所需要的所有依赖。cuda、 cudnn（我好像11.1\11.7\10.2都有，看自己的驱动适合哪个吧）【吃够了配环境的苦不想从头开始，等哪天换电脑了再记录（先浅浅的放个目录）】我们使用官方权重进行训练前，一定要先重参数化。yolo的数据集需要的标签格式是txt文件。下载好后，在我们的Pycharm中打开。选择之前创建的虚拟环境。

2023-11-25 16:52:20 330

原创从NCNN提取算子转为C——激活函数

NCNN框架中提取可用算子并转为C

2023-11-23 18:01:37 448

原创 Python写一个图像清晰度检测的程序

读取文件夹中图片并对图像的清晰度进行评估。

2023-11-23 14:20:31 900

原创 Jetson Xavier NX配置YOLOV5环境

例如，我的文件原路径是：Download/cuda-10.2, 我的指令就应该是sudo cp -r Download/cuda-10.2 /usr/local。然后将/usr/local中的cuda-10.2中的targets解压，键盘输入a将进入Insert模式，然后将下方信息复制到文件末尾。然后esc退出Insert模式，然后键盘输入:wq 保存并退出。将Cuda10.2文件移到/usr/local中。安装完成后，重启系统，可以终端输入jtop调用。将cudnn文件中的三个deb文件拷到开发板里。

2023-03-25 15:17:33 1392 2

原创 Python GUI设计——PyQt5的学习实践记录day09（PyQt5常用控件【三】）

TabWidget在显示选项卡时，如果默认大小显示不下，会自动生成先前和先后的箭头，用户可以通过单击箭头，查看未显示的选项卡。【TabWidget：可以将窗口设计成多页，以便使窗口的功能划分为多个部分，而每个部分都可以包括多个子控件】TabWidget最常用的信号是currentChanged，该信号在切换选项卡时发射。【当删除某个选项卡时，选项卡会自动切换到前一个，因此也会弹出相应的信息提示】【QGroupBox类中最常用的是setTitle()方法，如下👇：】————————————晚饭时间到！

2023-02-23 18:49:27 1293

原创 Python GUI设计——PyQt5的学习实践记录day07、08（PyQt5常用控件【二】）

【ComboBox控件常用的信号有两个：activated和currentIndexChanged，其中activated信号在用户选中一个下拉选项时发射，而currentIndexChanged信号则在下拉选项的索引发生改变时发射】【ListWidget是ListView的升级版，自身内置了一个数据存储模型QListWidgetItem，在使用时，不用像ListView一样先建立模型，而直接使用addItem()或者addItems()方法即可添加列表项】

2023-02-22 19:05:39 492

原创 Python GUI设计——PyQt5的学习实践记录day04、05、06（PyQt5常用控件【一】）

Layouts——布局管理：控件名称说明垂直布局水平布局GridLayout网格布局FormLayout表单布局Spacers——弹簧：控件名称说明水平弹簧垂直弹簧Buttons——按钮类控件名称说明PushButton按钮ToolButton工具按钮单选按钮复选框命令链接按钮对话框按钮盒Item Views(Model-Based)——项目视图控件名称说明ListView列表视图TreeView树视图TableView表格视图。

2023-02-14 18:28:43 1244

原创 Python GUI设计——PyQt5的学习实践记录day03（PyQt窗口设计基础）

PyQt5窗口运行时默认居中显示在屏幕中，如果想自定义窗口的显示位置，可以根据窗口的大小和屏幕大小来进行设置。在使用setStyleSheet()函数设置窗口背景色之后，窗口中的控件也会继承窗口的背景色，如果想要为控件设置背景图片或图标，需要使用setPixmap()或者setIcon()函数来完成。👆从上图可以看出来，图像没有显示完全，这是因为在使用QPalette对象为窗口设置背景图片时，默认是平铺显示的。在编写代码时，对窗口的任何设置和使用都是通过。QtDesigner-资源添加背景图。

2023-02-13 18:33:43 2835

原创 Python GUI设计——PyQt5的学习实践记录day02（认识、使用OtDesigner）

（2）在Pycharm中选择保存好的ui文件，然后在tools——>external tool选择PyUIC。（5）Widget：通用窗口【与Main Window不同，是一个什么都没有的空窗口】（1）Dialog with Buttons Bottom：按钮在底部的对话框窗口。（2）Dialog with Buttons Right：按钮在右上角的对话框窗口。（3）Dialog without Buttons：没有按钮的对话框窗口。（4）Main Window：一个带菜单、停靠窗口和状态栏的主窗口。

2023-02-10 12:02:30 648

原创 Python GUI设计——PyQt5的学习实践记录day01（安装配置python、pycharm以及所需模块）

带有x86的表示可以在Windows32位系统上使用，带有x86_64的则表示可以在Windows64位系统上使用。1.3 勾选Install for all users，设置安装路径【不要中文和空格】，然后Install。测试一下，在环境中import PyQt5如果出现

2023-02-09 15:42:43 529

原创 C++学习笔记

1.宏常量：#define 常量名常量值2.const 数据类型常量名 = 常量值1.1 数据类型数组名[数组长度];1.2 数据类型数组名[数组长度] = {值1,值2......};1.3 数据类型数组名[] = {值1,值2......};【数组的特点】：放在一块连续的内存空间数组中每个元素都是相同的数据类型数组元素的下标是从0开始索引的如果在初始化数据时没有全部填写完，那么会用0来填补完整作用：将一段经常使用的代码封装起来，减少重复代码2.1 返回值类型2.2 函数名。

2023-02-03 10:11:18 963

原创关于Yolo环境配置、模型训练问题记录

yolo运行中的问题小记

2023-02-02 18:17:33 4243 7

原创从安装Ubuntu开始配置RK3588的模型转换环境

从安装Ubuntu开始配置RK3588的模型转换环境

2023-02-02 15:42:20 2713 1

原创一些刷题记录

一些练习

2023-01-17 15:42:43 248

原创虚拟机配置AIO3399proC的RKNN-Toolkit

PC端配置RKNN-Toolkit

2023-01-16 17:06:35 545

原创 AIO3399ProC部署yolov5

AIO3399ProC部署yolo环境

2023-01-12 18:25:54 559

mongodb-compass-1.42.1-win32-x64.exe

mongodb-compass-1.42.1-win32-x64.exe 数据库构建工具

2024-02-18

mongodb-windows-x86-64-7.0.5-signed.msi

mongodb-windows-x86_64-7.0.5-signed.msi 数据库构建工具

2024-02-18

ffmpeg-python-0.2.0.zip

ffmpeg-python-0.2.0,ffmpeg在python调用的开发库

2024-01-23

FFmpeg-master.zip

FFmpeg源码库

2024-01-23

stb-master.zip

纯C编写的图像处理库

2023-12-01

cmake-3.27.9-windows-x86-64.zip

Windows-x85_64 Cmake

2023-12-01

CALCULUS MADE EASY.pdf

让微积分变得简单

2023-11-24

A Course of Pure Mathematics.pdf

本书是一部百年经典，在20世纪初奠定了数学分析课程的基础。书中对数学分析这一基础课程的重要内容——微积分学进行了系统的阐述，对很多经典的数学给出了严谨的证明方法，是Hardy数学思想智慧的结晶。另外，书中收集了许多极富思考价值的练习题，值得一提的是，还收集了当年英国剑桥大学荣誉学位考试所采用的试题。

2023-11-24

ship-detection.rar

可见光-船-数据集 nc: 5 names: ['container', 'cruise', 'fish-b', 'sail boat', 'warship']

2023-11-25

infrared hit-uav.rar

红外航拍 0: Person 1: Car 2: Bicycle 3: OtherVehicle 4: DontCare

2023-11-25

bus and car.rar

包含Bus、car特写图像，多角度，多背景

2023-11-25

augmentation　paper.rar

数据增广相关paper

2023-11-24

linux-command-master.zip

Linux常用指令集

2023-11-24

Python-search.rar

Python爬取关键词图像并保存到本地

2023-11-24

ImageCheck.rar 图像清晰度评估+推拉流

在进行动态的目标识别时，由于设备移动，可能存在大量的模糊图像，这里采用OpenCV先对每帧数据进行一个清晰度的评估，低于要求阈值的图像扔弃，符合要求的数据推送到检测层来进行目标识别

2023-11-24

公路地面地标线数据集，包含原始图像和mask标签

夜晚的公路地面地标线数据集，包含原始图像和mask标签

2023-11-23

地面地标线数据集，包含原始图像和mask标签

白天的地面地标线数据集，包含原始图像和mask标签

2023-11-23

各种角度的路面裂痕.rar

路面裂痕数据集

2023-11-23

各种路面的路面裂痕.rar

各种路面的路面裂痕

2023-11-23

ncnn-master.zip

由腾讯优图开源的深度学习推理框架

2023-11-22

Python实现创意版Hello World

2025-07-15

汇编实现创意版Hello World

2025-07-15

Html实现创意版Hello World

2025-07-15

C语言实现创意版Hello World

2025-07-15

目标检测数据集-无人机视角下人、车数据(已标注)

8000+p已标注无人机采集人车数据

2025-07-15

气球分割数据集0001

2025-07-15

基于Streamlit的数据可视化系统

1. 登录功能 2. 上传csv数据 3. 后台分析数据 4. 更新数据分析结果及其可视化 5. 数据分析查询(数据概览、单双变量分析、时间序列分析等) 6. 数据管理(增删查下载) 7. 退出登录

2025-06-28

基于YOLOv8的目标检测

1. 上传YOLOv8模型 2. 选择目标数据路径 3. 选择标签导出路径 4. 自定义阈值或使用默认阈值 5. 开始检测 6. 结束后可以在目标路径检查检测文件 7. 软件终端打印检测进程和相关报错信息等

2025-06-28

PCB板-元器件数据集

VOC格式数据，PCB板元器件检测数据集

2025-06-25

室外场景热红外人、车数据-01

1. YOLO标注格式 2. 固定机位 3. car、person两个类别 4. 640*640原始图像压缩包受上传限制划分为三个分开上传：室外场景热红外人、车数据-02：https://download.youkuaiyun.com/download/weixin_43342667/91149162 室外场景热红外人、车数据-03：https://download.youkuaiyun.com/download/weixin_43342667/91149159

2025-06-25

室外场景热红外人、车数据-02

1. YOLO标注格式 2. 固定机位 3. car、person两个类别 4. 640*640原始图像压缩包受上传限制划分为三个分开上传

2025-06-25

室外场景热红外人、车数据-03

1. YOLO标注格式 2. 固定机位 3. car、person两个类别 4. 640*640原始图像压缩包受上传限制划分为三个分开上传

2025-06-25

MASA github依赖包

pip install git+https://github.com/openai/CLIP.git --no-deps pip install git+https://github.com/siyuanliii/TrackEval.git pip install git+https://github.com/SysCV/tet.git#subdirectory=teta pip install git+https://github.com/scalabel/scalabel.git@scalabel-evalAPI pip install git+https://github.com/TAO-Dataset/tao pip install git+https://github.com/lvis-dataset/lvis-api.git

2025-01-10

TA关注的人

mongodb-compass-1.42.1-win32-x64.exe

mongodb-windows-x86-64-7.0.5-signed.msi

ffmpeg-python-0.2.0.zip

FFmpeg-master.zip

stb-master.zip

cmake-3.27.9-windows-x86-64.zip

CALCULUS MADE EASY.pdf

A Course of Pure Mathematics.pdf

ship-detection.rar

infrared hit-uav.rar

bus and car.rar

augmentation paper.rar

linux-command-master.zip

Python-search.rar

ImageCheck.rar 图像清晰度评估+推拉流

公路地面地标线数据集，包含原始图像和mask标签

地面地标线数据集，包含原始图像和mask标签

各种角度的路面裂痕.rar

各种路面的路面裂痕.rar

ncnn-master.zip

Python实现创意版Hello World

汇编实现创意版Hello World

Html实现创意版Hello World

C语言实现创意版Hello World

目标检测数据集-无人机视角下人、车数据(已标注)

气球分割数据集0001

基于Streamlit的数据可视化系统

基于YOLOv8的目标检测

PCB板-元器件数据集

室外场景热红外人、车数据-01

室外场景热红外人、车数据-02

室外场景热红外人、车数据-03

MASA github依赖包

Matching Anything by Segmenting Anything模型

Matching Anything By Segmenting Anything

Matching Anything By Segmenting Anything预训练权重

jdk-11.0.22-linux-aarch64-bin.tar.gz

基于Flask+MongoDB+HTML的一个课题管理程序

yolov9-c.pt

yolov9-e.pt

关于对运动中的物体会丢失识别框，错误捕捉目标还有精度陡然降低的问题

augmentation　paper.rar