youtube faces数据集中,下载下来,发现frame_images_DB文件中的图片文件和TxT文本标注文件数量不一致,经查看,出现了许多空白表注文件;
1.将所有的图像文件复制到工程目录下的video文件夹下;
2.将所有的txt文件复制到工程目录下的1文件夹下;
3.读取.\\video文件夹下所有一级目录的名称存到hashset中;
4.读取.\\1文件夹中的所有txt文件名称,且只取第一个.号前的字符;
如:Aaron_Eckhart.labeled_faces;取:Aaron_Eckhart;
5.查询取得的字符是否存在于hashset中,若不存在,则删除该txt文件;
6.统计所有的video文件夹下的一级目录的数量;统计所有的txt文件数量对比是否一致;
#include <iostream>
#include <string>
#include <unordered_set>
#include <windows.h>
// Function to read directory names from a given path
void ReadDirectory(const std::string& path, std::unordered_set<std::string>& dirNames)
{
WIN32_FIND_DATAA fileData;
HANDLE hFind = INVALID_HANDLE_VALUE;
std::string searchPath = path + "\\*";
hFind = FindFirstFileA(searchPath.c_str(), &fileData);
if (hFind != INVALID_

文章描述了一个处理youtubefaces数据集的过程,主要解决图片和TXT标注文件数量不一致的问题。通过复制图像和TXT文件到指定目录,然后读取视频文件夹下的一级目录名并存储,接着对比TXT文件的名称,删除不存在对应图片的TXT文件。最后统计目录和TXT文件数量进行一致性检查。
最低0.47元/天 解锁文章
5091

被折叠的 条评论
为什么被折叠?



