本文来源公众号“OpenCV与AI深度学习”,仅用于学术分享,侵权删,干货满满。
原文链接:实战 | 使用姿态估计算法构建简单的健身训练辅助应用程序
姿态估计简介
姿势估计是一个研究深入的领域,可应用于动作识别、活动跟踪、增强现实、动画、游戏等。姿势估计的目标是检测图像或视频中人体部位(如关节和四肢)的位置和方向。
姿态估计主要有两种方法:单人姿势估计和多人姿势估计。单人姿势估计可以找出图像中一个人的姿势。它知道这个人在哪里,以及要寻找多少个关键点,这是一个回归问题。多人姿势估计则有所不同。它试图解决一个更难的问题,即图像中有多少人,他们的位置都是未知的。
单人姿势估计可以进一步分为两种框架:基于直接回归和基于热图。基于直接回归的框架从特征图中预测关键点。基于热图的框架生成图像中所有关键点的热图,然后使用其他方法构建最终的火柴人图。
寻找正确的关键点检测模型
目前可用的一些最佳模型(例如OmniPose)拥有令人印象深刻的准确性。同样引起我注意的是OpenMMLab 的姿势估计工具箱。它为与姿势估计相关的所有内容提供了一个全面而强大的框架,包括用于比较不同模型的基准。
我一直在寻找一个简单而轻量级的解决方案,因此我决定使用 Google 的 MoveNet。
官方链接:MoveNet:超快且准确的姿态检测模型 | TensorFlow Hub
MoveNet 是一个紧凑而高效的姿势估计模型,非常适合移动和嵌入式设备。MoveNet 只有约 4M 个参数,而 OmniPose 有约 68M(精简版约 20M)。它的小巧和简单使其成为我项目的理想选择,让我可以快速进行实验和原型设计,而无需大量计算资源。虽然它可能无法提供与某些更高级模型相同的准确度,但它是