122FPS、51.8%AP的超轻量关键点算法PP-TinyPose来啦!

在人机交互场景中,机器可以识别人的手势、肢体动作、表情,你可知背后的核心技术是什么吗?

没错,就是关键点检测技术,它能帮你实现精准的人机交互任务,如手势控制、智能健身、体感游戏等, 还可以识别交通违规、打架斗殴、违规操作等异常行为。

话不多说,我们直接看效果:

9f2ba043d11a01bd20d6431b3e251621.png

‍‍1a50952e927186ca240a50b2510d64d6.gif6f0ec2bd3636e4e4ebc04af50e94a132.gif

以上视频引用于公开数据[1][2][3][4]

古语云:工欲善其事,必先利其器!要高质量实现关键点检测任务,没有利器怎么能行!今天给大家奉上的这个开源算法PP-TinyPose,仅凭端侧微弱算力,使用飞桨轻量化推理引擎Paddle Lite,单人场景FP16推理竟可达到超高帧率122FPS、精度51.8%AP,绝对可以称得上一把利刃。话不多说,赶紧送上传送门,如果觉得还不错,还请Star鼓励哦

项目链接

https://github.com/PaddlePaddle/PaddleDetection

那关键点检测算法这么多,PP-TinyPose到底强在哪里呢?下面就给大家强势揭秘。

精度高、速度快

关键点检测算法往往需要部署在轻量化、边缘端设备上,因此长期以来都存在一个难题:精度高、速度则慢、算法体积也随之增加。而PP-TinyPose的出世彻底打破了这个僵局,采用Top-Down的方式,先应用3.3M、150FPS的超轻量检测网络PP-PicoDet检测出人体,再用基于Lite-HRNet的移动端优化模型,检测对应关键点,由此确保关键点检测的高精度,同时扩大数据集,减小输入尺寸,预处理与后处理加入AID、UDP和DARK等策略,保证模型的高性能。实现速度在FP16下122FPS的情况下,精度也可达到51.8%AP,不仅比其他类似实现速度更快,精度更是提升了130%。

46c68066e2db3386db31859227f8cada.gif

以上视频引用于公开数据[3]

24c82e16d94b7eb140c93ca5e3d0d3e9.png

微小目标效果好

PP-TinyPose除了在日常关键点检测任务上拥有极强的通用性,针对小目标出现在大尺幅图像中的产业常见难题场景完成一系列针对性的优化,从而对小目标进行关键点检测时,依然能保持同样的精度与速度,效果直接看图:

d3389fb7fce1f5d7f8f6e8cb449c3a07.png

以上图片引用于公开数据[1]

多人同时检测

精准快速

更特别的是,PP-TinyPose还能同时实现多人关键点检测,且效果超强!不仅对于检测人数无限制,其速度和精度也依旧优秀!与开源界其他类似实现相比,检测人数、精度与性能上均有明显优势,直接上图对比:

38c0563bb648b543a84ca38907e1ed6b.gif

以上视频引用于公开数据[3]

7ca1cdc4c45e4a1b9c80a2ade45e1018.png

快速边缘部署

为了满足产业开发者在摄像头、车辆、机顶盒、手机等边缘端部署的强烈需求,PP-TinyPose借助飞桨轻量化推理引擎Paddle Lite的能力,为大家提供超便捷的边缘侧部署方案,并提供在手机端部署的保姆级教程及效果展示Demo,让大家快速从“想用”升级到“能用”然后快速上线。

3335eb8cbc16789ab60cee5a667cca0e.gif

赶紧点击下方链接下载APP体验吧!

https://github.com/PaddlePaddle/PaddleDetection/tree/release/2.3/configs/keypoint/tiny_pose

产业场景快速融合

除了技术产品本身的优势,PP-TinyPose在产业场景实际落地的速度和效果也极其优秀。

以摔倒检测为例,在上海泰思通公司的实际业务中,应用PP-TinyPose检测出人体关键点,结合逻辑规则进行行为分析,历时一周就实现了“实时人物摔倒识别”部署在Windows服务器上的Nvidia GeForce RTX3070,耗时仅15ms,高效率地保障了工作人员及公司资产的安全。

e0f5fcce3e88dd3013373e33774fe192.gif

以上视频引用于泰思通业务数据[5]

除此之外,PP-TinyPose的能力可以快速被应用到异常行为识别、等更多高价值领域发挥作用。

是不是迫不及待想体验了呢?

赶紧上项目首页体验一下吧:

https://github.com/PaddlePaddle/PaddleDetection

图片数据引用说明:

[1] Lin T Y, Maire M, Belongie S, et al. Microsoft coco: Common objects in context[C]//European conference on computer vision. Springer, Cham, 2014: 740-755.

[2] Kay W, Carreira J, Simonyan K, et al. The kinetics human action video dataset[J]. arXiv preprint arXiv:1705.06950, 2017.

[3] YouTube. (2016, August 10). 100 People of Dance [Video file]. Retrieved from https://www.youtube.com/watch?v=qrTi2aLx8dw 

[4] Myznik, E. (2020, June 22). Photo by Egor Myznik on unsplash. Beautiful Free Images & Pictures. Retrieved November 16, 2021, from https://unsplash.com/photos/NkGGF6BvU88.

[5] TaiSiTong. (2021 November 3).

关注公众号,获取更多技术内容~

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值