提取mat标注文件中的关键点数量并输出到csv和txt文件（shanghaiTech数据集）

最新推荐文章于 2025-04-16 10:18:59 发布

原创

最新推荐文章于 2025-04-16 10:18:59 发布 · 635 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#python #计算机视觉

该文介绍了一种方法来处理ShanghaiTech数据集的MAT标注文件，通过Python的Scipy库读取MAT文件获取点坐标，然后批量读取图片路径，记录关键点数量和图片名称，最终将信息保存到CSV文件中，方便后续的图像分析和模型训练。

关于shanghaiTech的介绍，可以看我之前的写的博客（https://blog.youkuaiyun.com/johnhamtom/article/details/104481186?spm=1001.2014.3001.5501）
这里采用的文件结构如下图所示，其中images存放图片，ground_truth存放对应的标注文件：
在这里插入图片描述
参考CSRNet的官方源码(https://github.com/leeyeehoo/CSRNet-pytorch)中的make_dataset.py可以得知，读取mat标注文件并获取其点坐标的代码如下：

mat = io.loadmat(img_path.replace('.jpg','.mat').replace('images','ground_truth').replace('IMG_','GT_IMG_'))
gt = mat["image_info"][0,0][0,0][0] #gt为用列表存储的点坐标对

知道如何获取mat文件的点坐标后，直接批量读取mat文件，并在读取的时候记录关键点数量和图片名称即可，一些说明写在了注释中，代码如下：

import scipy.io as io
import glob
from image import *
import pandas as pd


# 设置根目录地址
root = r'.\Shanghai'
# 根据根目录地址合成图片地址
part_A_train

最低0.47元/天解锁文章

提取mat标注文件中的关键点数量并输出到csv和txt文件（shanghaiTech数据集）

1 条评论