- 博客(28)
- 收藏
- 关注
原创 Magic Tokens: Select Diverse Tokens for Multi-modal Object Re-Identification
单模态对象重识别(ReID)在复杂视觉场景中保持鲁棒性方面面临着巨大挑战。相比之下,多模态对象ReID利用来自不同模态的互补信息,显示出实际应用的巨大潜力。然而,以前的方法可能容易受到不相关背景的影响,并且通常忽略模态差距。为了解决上述问题,研究团队提出了一种名为EDITOR的新型学习框架,用于从视觉变换器中选择多样化的标记以进行多模态对象ReID。研究团队首先使用共享的视觉变换器提取来自不同输入模态的标记化特征。然后,研究团队引入空间-频率标记选择(SFTS)模块,自适应地选择具有空间和频率信息的以对象
2025-01-24 15:51:47
812
原创 通过多模态特征选择提升对象重识别的性能:EDITOR框架的探索
EDITOR框架结合了空间-频率标记选择(SFTS)和分层掩蔽聚合(HMA),有效地选择和聚合多模态特征。为了减少背景对重识别性能的影响,框架还引入了背景一致性约束(BCC)和以对象为中心的特征精炼(OCFR)损失。这些创新的设计使得EDITOR在处理复杂的多模态数据时更为表现出色。
2025-01-22 11:10:24
422
原创 从零开始用Docker构建自己的项目环境
创建一个目录用于存储Docker镜像和其他相关文件。这里我用的是自己虚拟机中某个项目的环境打包的镜像。如果已安装会出现如👇。
2025-01-20 15:03:02
383
原创 从分割到匹配:MASA (Matching Anything by Segmenting Anything)
MASA(Matching Anything By Segmenting Anything)提供了一个通用的实例外观模型,用于匹配任何领域中的任何对象。在复杂场景中,对相同物体的跨帧关联相当重要,尤其是多目标跟踪,而在此之前的方法主要依赖于特定领域的标记数据集,导致模型在面对不同类型的视频或场景时,无法有效地进行物体识别和跟踪。而作者提出的MASA是一种用于稳健实例关联学习的新方法,能够跨不同域匹配视频中的任何对象,而无需跟踪标签。
2025-01-09 15:27:59
486
原创 基于YOLOv9训练自己的数据集
并cd到torch和torchvision的下载目录并通过pip install 下载。这里的yaml文件和路径等需要根据自己的数据集进行修改。打开setting设置自己的虚拟环境。将压缩包放到自己的目标目录解压。配置虚拟环境的工程依赖。
2024-02-26 23:56:45
1384
原创 瑞芯微3588系统重装
进入tools打开RKDevTool.exe,可以看到下面显示发现Loader设备,然后按照下面的步骤进行固件烧录。点击固件将对应路径的固件,等待固件加载然后“升级",等待升级完成就可以重启了。下载 Release_DriverAssistant.zip,解压,然后运行里面的 DriverInstall.exe。为了所有设备都使用更新的驱动,请先选择驱动卸载,然后再选择驱动安装。断电长按开发板的recover键三秒,不松开进行上电然后再松开recover,条件:USB数据线、Ubuntu固件(
2024-02-15 10:48:04
2536
原创 一些常用的工具资料记录
特征提取和描述:包括提取和描述图像中的特征点、计算特征描述子等。STB Vorbis:用于解码Ogg Vorbis音频文件的库。STB Truetype:用于渲染TrueType字体的库。三维重建:包括从多个图像中恢复三维场景的结构和深度信息等。物体检测和跟踪:包括人脸检测、行人检测、运动目标跟踪等。STB Image:用于加载和保存各种图像格式的库。STB Rect Pack:用于矩形打包算法的库。图像处理:包括图像滤波、边缘检测、图像变换等。STB DXT:用于压缩和解压DXT纹理的库。
2023-12-01 12:13:41
301
原创 Code::Blocks 安装、配置opencv
将下载的文件放入目录然后在codeblocks中开始配置:路径输入刚才下载解压后的路径,注意保持下面几个可执行文件的路径正确。除了选择安装路径以外,一路默认就好,然后codeblocks就安装好了。接着开始装编译器(为什么没有一起安装下载呢。因为网太差根本下不下来)
2023-11-30 15:14:24
365
原创 Windows下载安装Opencv并在visual studio配置
C/C++——添加 OpenCV 的头文件路径。选择安装路径,然后Extract。
2023-11-30 14:09:08
220
原创 Windows下Visual Studio安装部署Tensorflow开始写一个简单的小网络
在“C/C++”选项卡中,将“预处理器”设置为“_CRT_SECURE_NO_WARNINGS”,以避免由于使用不安全的函数而导致的编译器警告。在“链接器”选项卡中,将“附加依赖项”设置为“tensorflow.lib”。这将告诉链接器链接TensorFlow C库。在“链接器”选项卡中,在右侧面板的“常规”下拉菜单中,选择“附加库目录”,添加TensorFlow C库的库文件路径。在“VC++目录”选项卡中,将TensorFlow C库的头文件路径添加到“包含目录”列表中。这里我下的是cpu版,
2023-11-29 17:03:42
972
原创 数据结构学习记录——主要术语、概念
20.二叉查找树(binary search tree):也称为排序二叉树,是一棵空树或具有以下性质的二叉树:①若左子树不为空,则左子树上所有结点的值均小于它的根节点的值;19.平衡二叉树(balance binary tree):是一种特殊的二叉树,它是一棵空树或者它的左右两颗子树的高度差的绝对值不超过1,并且左右两个子树都是一棵平衡二叉树。12.栈(stack):是一种特殊的线性表,只能在表的一端进行插入和删除操作,被插入的新元素必须放在当前栈顶元素之前,而删除的元素则是当前栈顶元素。
2023-11-25 16:53:19
65
原创 YOLOV7下训练自己的数据集
在目录表中可以看到,有一个requirements.txt,里面包含了yolov7所需要的所有依赖。cuda、 cudnn(我好像11.1\11.7\10.2都有,看自己的驱动适合哪个吧)【吃够了配环境的苦不想从头开始,等哪天换电脑了再记录(先浅浅的放个目录)】我们使用官方权重进行训练前,一定要先重参数化。yolo的数据集需要的标签格式是txt文件。下载好后,在我们的Pycharm中打开。选择之前创建的虚拟环境。
2023-11-25 16:52:20
286
原创 Jetson Xavier NX配置YOLOV5环境
例如,我的文件原路径是:Download/cuda-10.2, 我的指令就应该是sudo cp -r Download/cuda-10.2 /usr/local。然后将/usr/local中的cuda-10.2中的targets解压,键盘输入a将进入Insert模式,然后将下方信息复制到文件末尾。然后esc退出Insert模式,然后键盘输入:wq 保存并退出。将Cuda10.2文件移到/usr/local中。安装完成后,重启系统,可以终端输入jtop调用。将cudnn文件中的三个deb文件拷到开发板里。
2023-03-25 15:17:33
1304
2
原创 Python GUI设计——PyQt5的学习实践记录day09(PyQt5常用控件【三】)
TabWidget在显示选项卡时,如果默认大小显示不下,会自动生成先前和先后的箭头,用户可以通过单击箭头,查看未显示的选项卡。【TabWidget:可以将窗口设计成多页,以便使窗口的功能划分为多个部分,而每个部分都可以包括多个子控件】TabWidget最常用的信号是currentChanged,该信号在切换选项卡时发射。【当删除某个选项卡时,选项卡会自动切换到前一个,因此也会弹出相应的信息提示】【QGroupBox类中最常用的是setTitle()方法,如下👇:】————————————晚饭时间到!
2023-02-23 18:49:27
1203
原创 Python GUI设计——PyQt5的学习实践记录day07、08(PyQt5常用控件【二】)
【ComboBox控件常用的信号有两个:activated和currentIndexChanged,其中activated信号在用户选中一个下拉选项时发射,而currentIndexChanged信号则在下拉选项的索引发生改变时发射】【ListWidget是ListView的升级版,自身内置了一个数据存储模型QListWidgetItem,在使用时,不用像ListView一样先建立模型,而直接使用addItem()或者addItems()方法即可添加列表项】
2023-02-22 19:05:39
430
原创 Python GUI设计——PyQt5的学习实践记录day04、05、06(PyQt5常用控件【一】)
Layouts——布局管理:控件名称说明垂直布局水平布局GridLayout网格布局FormLayout表单布局Spacers——弹簧:控件名称说明水平弹簧垂直弹簧Buttons——按钮类控件名称说明PushButton按钮ToolButton工具按钮单选按钮复选框命令链接按钮对话框按钮盒Item Views(Model-Based)——项目视图控件名称说明ListView列表视图TreeView树视图TableView表格视图。
2023-02-14 18:28:43
1156
原创 Python GUI设计——PyQt5的学习实践记录day03(PyQt窗口设计基础)
PyQt5窗口运行时默认居中显示在屏幕中,如果想自定义窗口的显示位置,可以根据窗口的大小和屏幕大小来进行设置。在使用setStyleSheet()函数设置窗口背景色之后,窗口中的控件也会继承窗口的背景色,如果想要为控件设置背景图片或图标,需要使用setPixmap()或者setIcon()函数来完成。👆从上图可以看出来,图像没有显示完全,这是因为在使用QPalette对象为窗口设置背景图片时,默认是平铺显示的。在编写代码时,对窗口的任何设置和使用都是通过。QtDesigner-资源添加背景图。
2023-02-13 18:33:43
2697
原创 Python GUI设计——PyQt5的学习实践记录day02(认识、使用OtDesigner)
(2)在Pycharm中选择保存好的ui文件,然后在tools——>external tool选择PyUIC。(5)Widget:通用窗口【与Main Window不同,是一个什么都没有的空窗口】(1)Dialog with Buttons Bottom:按钮在底部的对话框窗口。(2)Dialog with Buttons Right:按钮在右上角的对话框窗口。(3)Dialog without Buttons:没有按钮的对话框窗口。(4)Main Window:一个带菜单、停靠窗口和状态栏的主窗口。
2023-02-10 12:02:30
557
原创 Python GUI设计——PyQt5的学习实践记录day01(安装配置python、pycharm以及所需模块)
带有x86的表示可以在Windows32位系统上使用,带有x86_64的则表示可以在Windows64位系统上使用。1.3 勾选Install for all users,设置安装路径【不要中文和空格】,然后Install。测试一下,在环境中import PyQt5如果出现
2023-02-09 15:42:43
473
原创 C++学习笔记
1.宏常量:#define 常量名 常量值2.const 数据类型 常量名 = 常量值1.1 数据类型 数组名[数组长度];1.2 数据类型 数组名[数组长度] = {值1,值2......};1.3 数据类型 数组名[] = {值1,值2......};【数组的特点】:放在一块连续的内存空间数组中每个元素都是相同的数据类型数组元素的下标是从0开始索引的如果在初始化数据时没有全部填写完,那么会用0来填补完整作用:将一段经常使用的代码封装起来,减少重复代码2.1 返回值类型2.2 函数名。
2023-02-03 10:11:18
899
MASA github依赖包
2025-01-10
Matching Anything by Segmenting Anything模型
2025-01-09
Matching Anything By Segmenting Anything预训练权重
2025-01-09
ship-detection.rar
2023-11-25
A Course of Pure Mathematics.pdf
2023-11-24
ImageCheck.rar 图像清晰度评估+推拉流
2023-11-24
基于U-Net的递归残差卷积神经网络(R2U-Net)在医学图像分割中的应用.pdf
2023-11-22
Approaching (Almost) Any Machine Learning Problem-CN版
2023-11-02
yolov7-e6e-training.pt yolov7-w6-training.pt yolov7x-training.pt
2023-07-03
关于对运动中的物体会丢失识别框,错误捕捉目标还有精度陡然降低的问题
2022-11-07
TA创建的收藏夹 TA关注的收藏夹
TA关注的人