Yolov7-pose 训练body+foot关键点

多财多亿,凭亿近人

已于 2022-11-28 10:06:03 修改

阅读量7.7k

点赞数 29

分类专栏：人体姿态估计计算机视觉文章标签：深度学习 python 人工智能

于 2022-08-26 15:04:13 首次发布

本文链接：https://blog.youkuaiyun.com/qq_38284951/article/details/126543189

版权

人体姿态估计同时被 2 个专栏收录

7 篇文章

订阅专栏

计算机视觉

7 篇文章

订阅专栏

本文介绍YoloV7网络结构，并基于COCO数据集进行人体关键点检测的训练与验证。涵盖网络架构解析、数据集准备、训练代码调整及实验结果分析。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、Yolov7介绍：

yolov7网络由三个部分组成：input，backbone和head，与yolov5不同的是，将neck层与head层合称为head层，实际上的功能的一样的。对各个部分的功能和yolov5相同，如backbone用于提取特征，head用于预测。

根据上图的架构图走一遍网络流程：先对输入的图片预处理，对齐成640*640大小的RGB图片，输入到backbone网络中，根据backbone网络中的三层输出，在head层通过backbone网络继续输出三层不同size大小的feature map（以下简称fm），经过RepVGG block 和conv，对图像检测的三类任务（分类、前后背景分类、边框）预测，输出最后的结果。

推荐yolov7 网络架构深度解析_所向披靡的张大刀的博客-优快云博客

github在yolov7下面的pose部分

二、数据集准备

train 数据集基于coco_whole_body_train 改造。

原始格式

${POSE_ROOT}

|-- data

`-- |-- coco

`-- |-- annotations

| |-- coco_whole_body_train2017.json

| `-- coco_whole_body_val2017.json

|-- person_detection_results

| |-- COCO_val2017_detections_AP_H_56_person.json

`-- images

|-- train2017

| |-- 000000000009.jpg

| |-- 000000000025.jpg

| |-- 000000000030.jpg

| |-- ...

`-- val2017

|-- 000000000139.jpg

|-- 000000000285.jpg

|-- 000000000632.jpg

|-- ...

Json 信息

image：包含了，宽高，地址，图像名

annotations: 包含imageid iscrowd信息还有其他关键点的信息

"bbox": [

339.88,

22.16,

153.88,

300.73

Yolo的格式

`-- |-- annotations

| |-- person_keypoints_train2017.json

| `-- person_keypoints_val2017.json

|-- person_detection_results

| |-- COCO_val2017_detections_AP_H_56_person.json

`-- images

| |-- train2017

| | |-- 000000000009.jpg

| | |-- 000000000025.jpg

| | |-- ...

| `-- val2017

| |-- 000000000139.jpg

| |-- 000000000285.jpg

| |-- ...

`-- labels

| |-- train2017

| | |-- 000000000009.txt

| | |-- 000000000025.txt #这里面图片的keypoint信息，以YOLO格式展示

| | |-- ...

| `-- val2017

| |-- 000000000139.txt

| |-- 000000000285.txt #这里面图片的keypoint信息，以YOLO格式展示

| |-- ...

`-- train2017.txt #这里面放的内容是：相对路径+图片名字

`-- val2017.txt #这里面放的内容是：相对路径+图片名字

打开一个labels 下的000000391895.txt格式

0 0.651281 0.479236 0.240437 0.835361 0.575000 0.169444 1.000000 0.576562 0.144444 2.000000 0.000000 0.000000 0.000000 0.596875 0.133333 2.000000 0.000000 0.000000 0.000000 0.575000 0.233333 2.000000 0.679688 0.225000 2.000000 0.565625 0.347222 2.000000 0.696875 0.347222 2.000000 0.562500 0.425000 2.000000 0.000000 0.000000 0.000000 0.620313 0.463889 1.000000 0.685937 0.461111 1.000000 0.576562 0.536111 2.000000 0.720313 0.650000 2.000000 0.564063 0.683333 2.000000 0.740625 0.797222 2.000000

解析为：