NUS_WIDE数据库制作

介绍了NUS_WIDE数据库的构建方法,包括下载官方资源、读取图像和文本特征文件、创建索引矩阵等步骤,并针对前十类进行了特征提取。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

NUS_WIDE数据库是计算机视觉领域常用的数据库,NUS_WIDE HomePage  http://lms.comp.nus.edu.sg/research/NUS-WIDE.htm

下面介绍一下数据库制作方法:

  1. 打开上方超链接,
  2. 下载这几个文件,其中主要用到1, 2, 3;该数据库的主要信息官网上介绍的很详细,本人不再说明,打开Low_Level_Features文件夹,将下图所示的三个文件读取出;
  3. 三个文件分别对应269648张图片的特征,每个样本为500维的词袋视觉特征,BoW_Test_int 是按照官网上的划分的测试集, BoW_Train_int 是对应的训练集
  4. 打开tags文件夹,看到下图所示的三个文件,AllTags1k 对应269648张图片的文本特征,每个样本1000维的文本索引向量,读取出来并保存。
  5. 下面是最关键的步骤,索引的制作。AllLabels 文件夹下有81个文本文件,分别对应该类的索引,将81个文件读取出来做成369648*81的索引矩阵,其中做索引矩阵时尽量按照每类样本数量进行排序,数量最多的作为第一类,最少的作为最后一类。由于该数据库太大,参考相关文章,大部分都是用的前十类进行相关实验,前十类共有186577个样本,每一类的样本数如下图所示,,依照索引再分别取出对应的前十类的图像特征和文本特征,最后做出来的数据库图像、文本、索引大小分别为269648*500、269648*1000、269648*10。按照官网训练集和测试集的分类,原有的161789的训练集变为111810,原有的107859的测试集变为74767,样本的对应维度不变。

### NUS_WIDE 数据集概述 NUS_WIDE 是一个多标签图像数据集,在计算机视觉和多媒体研究领域被广泛使用[^1]。该数据集由新加坡国立大学(National University of Singapore, NUS)开发并公开发布,主要用于图像检索、跨模态学习以及多标签分类等任务。 #### 下载方式 NUS_WIDE 的主页提供了详细的文档说明和下载链接。可以通过访问官方页面获取完整的数据集文件: - 官方网站地址:[NUS-WIDE HomePage](http://lms.comp.nus.edu.sg/research/NUS-WIDE.htm) 需要注意的是,由于数据量较大(约 27 万张图片),建议提前确认网络环境是否适合大容量文件传输,并按照官网指引逐步完成下载过程。 #### 使用方法 对于实际应用中的 TC10 和 TC21 子集构建,通常会遵循如下原则: 1. **子集定义** - TC10 表示选取其中具有代表性的十个类别作为目标集合[^2]。 - 需要记录每张图片对应的路径信息、关联文本描述及其标注向量(即维度为 10 的二进制 label)。这些字段共同构成训练模型所需的基础输入形式。 2. **数据划分逻辑** 根据某些现有工作惯例,可以采用分层采样的办法来创建查询集 (query set),具体做法是从每一类里均匀抽取固定数量实例(比如各取 100 条记录形成初始测试池)[^3]。这种方案有助于平衡各类别的分布比例从而减少偏差影响最终效果评估准确性。 以下是实现上述功能的一个 Python 脚本片段示范如何读入原始 CSV 文件进而提取必要组成部分用于后续建模操作: ```python import pandas as pd def load_nus_wide_subset(file_path): """ 加载 NUS-WIDE 子集数据 参数: file_path (str): 包含图片路径、文本内容及标签的CSV文件位置 返回值: DataFrame: 整理后的表格结构对象 """ df = pd.read_csv(file_path) # 假设列名为 'image_path', 'text_content' 和 'labels' subset_df = df[['image_path', 'text_content', 'labels']] return subset_df if __name__ == "__main__": data = load_nus_wide_subset('path/to/your/tc10.csv') print(data.head()) ``` 此代码仅作示意之用,请依据实际情况调整参数设置或者扩展额外预处理步骤满足特定需求场景下的定制化要求。 ---
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值