- 博客(50)
- 收藏
- 关注
原创 读论文-MHFormer
尽管取得了重大进展,但由于深度模糊和自遮挡,从单目视频中估计3D人体姿势仍然是一项具有挑战性的任务。大多数现有的作品都试图通过利用空间和时间关系来解决这两个问题。然而,这些工作忽略了这样一个事实,即它是一个逆问题,其中存在多个可行解(即假设)。为了消除这一限制,我们提出了一个多假设转换器来学习多个貌似合理的姿势假设的时空表征。为了有效地建模多假设依赖关系并在假设特征之间建立强关系,我们引入了一个一对多对一的三阶段框架:(i)生成多个初始假设表示;
2023-06-06 13:16:04
1020
原创 读论文-GPRAR
高精度的预测对于自动驾驶等各种应用至关重要。现有的预测模型在现实世界中很容易出错,因为观察结果(例如人类的姿势和位置)通常是嘈杂的。为了解决这个问题,我们引入了GPRAR,一种基于图卷积网络的姿态重建和动作识别,用于人体轨迹预测。GPRAR 的关键思想是在嘈杂的场景下生成鲁棒特征:人类的姿势和动作。为此,我们使用两个新的子网络来设计 GPRAR: PRAR (姿态重建和动作识别)和 FA (特征聚合器)。PRAR 旨在从人体骨骼的连贯和结构特性中同时重建人体姿势和动作特征。
2023-05-30 20:35:24
671
原创 Transformer代码学习
来源:【Transformer代码(源码Pytorch版本)从零解读(Pytorch版本)】https://www.bilibili.com/video/BV1dR4y1E7aL?vd_source=1b66da498812ef1f46c7b8923a154fe1作者:DASOU仅用于学术分享!!!
2022-10-22 20:40:09
237
原创 行为识别现状调研
在场景识别中,有很大一部分研究是针对于人体行为识别的,主要进行识别的也是一些家庭内的危险行为,如小孩、老人摔倒检测,外来人员闯入等,这些都可归为人体行为识别的范畴之内。行为识别(action recognition),即根据视频图像完成对于人体动作的区分,这其中包括但不限于摔倒等危险动作。计算机视觉与模式识别会议将其分为五 项 子 任 务 [1]:1.未修剪视频分类(Untrimmed Video Classification) ,一段未修剪很长的视频序列,其中在时序上包含多个类型的动作,且其中很多动
2022-08-12 23:02:22
1751
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人