多模态行人识别
文章平均质量分 82
专心搞代码
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Harnessing the Power of MLLMs for Transferable Text-to-Image Person ReID利用MLLMs实现可转移的文本到图像的人ReID(7)
这段代码实现了一种有效的数据增强方法,可以在图像分类等任务中提高模型的性能和泛化能力。通过随机选择矩形区域并将其像素值设置为给定的均值,可以增加数据的多样性,使模型对不同的变化更加鲁棒。同时,代码中的参数可以根据具体的任务和数据集进行调整,以获得最佳的效果。这段 Python 代码实现了一种名为 “Random Erasing” 的数据增强方法,该方法随机选择图像中的一个矩形区域,并将其像素值设置为给定的均值。这种方法可以增加数据的多样性,提高模型的泛化能力。原创 2025-01-13 17:23:34 · 481 阅读 · 0 评论 -
Harnessing the Power of MLLMs for Transferable Text-to-Image Person ReID利用MLLMs实现可转移的文本到图像的人ReID(6)
然后遍历训练图像路径列表,为每个图像生成对应的身份标识、图像索引、图像路径、标题和一个固定的相似度列表,并将这些信息存储在一个列表中作为训练数据集。它遍历测试图像路径列表,为每个图像生成对应的身份标识、图像路径、标题和标题对应的身份标识,并将这些信息存储在一个字典中,最后返回这个字典作为测试数据集。的作用是合并多个 JSON 文件的内容到一个字典中,其中字典的键是图像文件名,值是一个列表,包含了来自不同 JSON 文件中对应图像的内容。分别处理训练标题路径列表和测试标题路径列表,得到训练和测试的标题字典。原创 2025-01-13 17:22:46 · 1170 阅读 · 0 评论 -
Harnessing the Power of MLLMs for Transferable Text-to-Image Person ReID利用MLLMs实现可转移的文本到图像的人ReID(5)
这段代码定义了一个用于处理 ICFG-PEDES 数据集的类,包括数据的初始化、分割注释、处理注释和检查数据可用性等功能。具体各个部分代码功能同该专栏第四篇。代码所属:datasets/icfgpedes.py。原创 2024-10-27 16:03:22 · 377 阅读 · 0 评论 -
Harnessing the Power of MLLMs for Transferable Text-to-Image Person ReID利用MLLMs实现可转移的文本到图像的人ReID(4)
例如,如果`Child`类的父类从`Parent`变为`NewParent`(假设`NewParent`也有兼容的`__init__`方法),`super()`调用仍然可以正常工作。如果是训练数据,会遍历注释列表,将每个注释中的图像路径和对应的标题添加到数据集列表中,并维护一个身份容器。如果是测试 / 验证数据,会遍历注释列表,将图像路径、标题和对应的身份标识分别添加到不同的列表中,然后构建一个字典作为数据集返回,并返回身份容器。- **优点** - 比较直观,容易理解,尤其是对于简单的继承关系。原创 2024-10-27 16:02:38 · 775 阅读 · 0 评论 -
Harnessing the Power of MLLMs for Transferable Text-to-Image Person ReID利用MLLMs实现可转移的文本到图像的人ReID(2)
通过这种方式,可以方便地在不同的代码文件中复用数据加载的逻辑,提高代码的可维护性和可扩展性。:当你希望快速创建一个新对象,并且新对象和原对象共享一些不可变对象(如数字、字符串等),但对于可变子对象可以接受它们被同时修改时,可以使用浅复制。例如,对一个包含大量不可变元素和少量可变子对象的复杂数据结构进行复制时,浅复制可以节省时间和内存,因为不需要完全复制所有的内容。是一个用于科学计算的强大 Python 库,提供了高效的多维数组对象和各种数学函数,广泛应用于数据分析、机器学习等领域。库,即 PyTorch。原创 2024-10-22 17:14:22 · 952 阅读 · 0 评论 -
Harnessing the Power of MLLMs for Transferable Text-to-Image Person ReID利用MLLMs实现可转移的文本到图像的人ReID(3)
过滤加载器函数的主要作用是根据特定的参数配置和数据集,创建一个经过过滤处理的数据集,并提供一个方便的数据加载器来高效地加载和处理数据,以满足特定的数据处理需求,可能是为了去除某些不符合特定条件的数据样本,或者对数据进行特定的预处理操作,以便后续的模型训练或其他数据分析任务能够更加高效地进行。(将输入的批次数据(一个包含多个字典的列表)转换为一个字典,其中键是数据的字段名,值是一个列表,包含该字段在每个样本中的值,并将值转换为张量或堆叠起来。),并创建对应的验证数据加载器。中的对应字典中获取的。原创 2024-10-22 19:52:52 · 904 阅读 · 0 评论 -
Harnessing the Power of MLLMs for Transferable Text-to-Image Person ReID利用MLLMs实现可转移的文本到图像的人ReID(1)
*一、特定操作的禁用** 1. Dropout 禁用 - Dropout 是一种在训练过程中常用的技术,它以一定的概率随机将神经元的输出设置为零,以防止过拟合。- `AutoModelForCausalLM.from_pretrained`: - 参数如`device_map`(指定模型加载到的设备,如“cpu”、“cuda”或“auto”)、`torch_dtype`(指定模型参数的数据类型,如`torch.float32`、`torch.bfloat16`等)主要影响模型的性能和资源利用。原创 2024-10-19 22:11:13 · 990 阅读 · 0 评论
分享