关于划分数据库时及处理CSV文件的问题研究记录

本文记录了数据库整理的过程,包括将图像信息存储为CSV文件,使用`pd.drop_duplicates`函数去除重复行,合并多个CSV文件,并根据数据集绘制分布图。在操作中,作者发现并分享了关于PyCharm头文件注释的误解。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

总体要求:
首先数据库的整理包括:

  1. 数据库中有252个文件夹,每个文件夹对应一个对象的人脸图像,为基于视频的连续帧,首先根据每幅图像的图像名,将其存成csv文件,包括 ***每幅图像的路径名、arousal值、valence值。***每一个文件夹,对应一个csv文件。
  2. 因为文件夹中存的为基于视频的连续帧,可能同一状态下的表情能持续n张图像,所以要对其进行精简,每一种不同A、V值对应的表情,只取第一张图像。
  3. 根据有可能某一人物对象对应n个视频,所以需要将同一人物对应的csv文件进行合并。
  4. 根据已经划分好的数据集,画出数据的整体分布图。

Here We Go~

1. 存储CSV并精简

首先文件夹长这个样子,图像名中包含了其arousal值和valence值,我们需要对字符串进行处理,得到对应的arousal、valence值保存。
在这里插入图片描述
在这里插入图片描述

import os, csv
import cv2 as cv
import pandas as pd

#首先进入根目录,遍历其下所有文件夹,并保存路径名
outer_path = r'F:\Database\Selected Image Quences per Video-AffWild'
folderlist = os.listdir(outer_path)
for folder in folderlist:
    inner_path = os.path.join(outer_path, folder)
    filelist = os.listdir(inn
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值