RGB-infrared(RGBT)数据任务中infrared(thermal)信息的使用方式

Detection

Learning Cross-Modal Deep Representations for Robust Pedestrian Detection

这篇文章的motivation和我之前想的不一样:希望使用红外图像进行detection,但是红外图像比较难获得,标注很少,希望通过少部分的红外图像来辅助train model,但是测试时还是只使用RGB进行detection。所以用了unsupervised deep learning。
emmm好像不太好借鉴

做法是首先train a model学习RGB到infrared image的映射,得到的模型会作为后续模型的一部分,从而保留了从红外学习到的一部分经验来辅助RGB的训练(好像是可以,但是不知怎么觉得有点怪怪的)

在这里插入图片描述
RRN是专门学习RGB到thermal的映射(RGBT中的T是thermal而非temperature好像
在这里插入图片描述
然后设计了一个multi-scale detection model,RRN是其中黄色部分:
在这里插入图片描述

### 寻找RGB-Infrared数据集的方法 对于计算机视觉研究中的RGB-Infrared数据集获取,LLVIP 数据集是一个重要的资源,该数据集专为低光照环境下的视觉任务设计,提供了可见光和红外成像的配对样本[^1]。此数据集适用于多种任务,包括但不限于可见光与红外图像融合、低光条件下的行人检测以及可见光至红外的图像翻译。 除了 LLVIP 数据集之外,其他可用的数据集还包括: - **KAIST Multispectral Pedestrian (KMP)** 数据集:这个数据集包含了日间和夜间场景下的人类热成像和可见光图像,适合用于开发和测试跨模态目标识别算法。 - **FLIR ADAS Dataset**:由前视红外(FLIR)公司发布的一个大型自动驾驶辅助系统训练集,其中含有丰富的标注信息,涵盖了不同天气状况和时间条件下采集到的RGBthermal infrared视频片段。 为了找到更多类似的公开数据集,可以访问专门收集并整理各类科研用途数据库网站,比如paperswithcode.com 或者 dataverse.org,在这些平台上通过关键词搜索功能输入“RGB Infrared”,即可发现一系列可供选择的研究素材库。 另外,学术会议论文也是了解最新发布的特定领域内高质量数据集合的有效途径之一;许多时候作者会在文章中提及所使用的具体数据源链接或下载方式。 ```python import requests def search_datasets(keyword="RGB Infrared"): base_url = "https://api.paperswithcode.com/api/v0/datasets/" params = {"q": keyword} response = requests.get(base_url, params=params) if response.status_code == 200: results = response.json() return [result['name'] for result in results] else: raise Exception(f"Failed to fetch data with status code {response.status_code}") print(search_datasets()) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值