行人属性数据集PA100K下载并解析

本文介绍了PA100K——一个大型行人属性数据集,包含10万张室外监控图像及26种属性标注。文章提供数据集下载链接,并分享了将原始标注文件转换为更易读格式的方法。

1. 行人属性数据集PA100K介绍

       PA-100K数据集是迄今为止用于行人属性识别的最大数据集,其中包含从室外监控摄像头收集的总共100000张行人图像,每张图像都有26个常用属性。根据官方设置,整个数据集随机分为80000个训练图像、10000个验证图像和10000个测试图像。

       博主将该数据集放到了百度云盘中,https://pan.baidu.com/s/1sOg6S3QU8NucfFj5SF50qg 提取码:lh02,请按照需求下载。

2. 行人数据解析

      从百度云下载数据后,发现标注信息是annotation.mat的标注文件,不好直观感受其标注信息。

      那么,下面就将annotation.mat解析处理,转化为我们熟悉的格式。转化代码如下:

import pandas as pd
import scipy
from scipy import io

data = scipy.io.loadmat('annotation.mat')

def mat2txt(data, key):
    subdata = data[key]
    dfdata = pd.DataFrame(subdata)
    dfdata.to_csv("%s.txt" % key, index=False)

if __name__ == "__main__":
    data = scipy.io.loadmat("annotation.mat")
    key_list = ["attributes", "test_images_name", "test_label",
                "train_images_name", "train_label",
                "val_images_name", "val_label"]
    for key in key_list:
        mat2txt(data, key)

          运行代码后,就把annotation.mat文件转化为几个.txt的文件。如下图所示:

           用查看attributes.txt  test_images_name.txt  test_label.txt 里面的内容如下(我用vim打开的):

 

如何训练行人属性模型,请参考:基于fastreid训练行人属性模型

推荐一个很好的行人属性训练工程:https://blog.youkuaiyun.com/Guo_Python/article/details/113735260

OK,有了这些数据,你就可以进行行人属性识别研究了。

另外一个公开数据集介绍PEAT:https://blog.youkuaiyun.com/hyk_1996/article/details/80322026

如需技术交流,请留言或微信:

 

运行环境 .NET Framework2.0 开发工具 Microsoft Visual Studio 2005 二. 部分代码说明(主要讲解异步分析和下载): 异步分析下载采取的策略是同时分析同时下载,即未等待数据全部分析完毕就开始把已经分析出来的图片链接开始下载下载成功的均在List框链接前面划上了√ ,未能下载的图片有可能是分析错误或者是下载异常。 1. 异步分析部分代码 /// /// 异步分析下载 /// private void AsyncAnalyzeAndDownload(string url, string savePath) { this.uriString = url; this.savePath = savePath; #region 分析计时开始 count = 0; count1 = 0; freq = 0; result = 0; QueryPerformanceFrequency(ref freq); QueryPerformanceCounter(ref count); #endregion using (WebClient wClient = new WebClient()) { AutoResetEvent waiter = new AutoResetEvent(false); wClient.Credentials = CredentialCache.DefaultCredentials; wClient.DownloadDataCompleted += new DownloadDataCompletedEventHandler(AsyncURIAnalyze); wClient.DownloadDataAsync(new Uri(uriString), waiter); //waiter.WaitOne(); //阻止当前线程,直到收到信号 } } /// /// 异步分析 /// protected void AsyncURIAnalyze(Object sender, DownloadDataCompletedEventArgs e) { AutoResetEvent waiter = (AutoResetEvent)e.UserState; try { if (!e.Cancelled && e.Error == null) { string dnDir = string.Empty; string domainName = string.Empty; string uri = uriString; //获得域名 http://www.sina.com/ Match match = Regex.Match(uri, @"((http(s)?://)?)+[\w-.]+[^/]");//, RegexOptions.IgnoreCase domainName = match.Value; //获得域名最深层目录 http://www.sina.com/mail/ if (domainName.Equals(uri
评论 6
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CV-deeplearning

请博主加个火腿

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值