
Action Recognition
文章平均质量分 96
The introduction of the researches on action recognition, especially the multi-view and cross-view action recognition based on skeleton data
FesianXu
腾讯-微信事业群-高级算法工程师, 百度-搜索策略部-前高级算法工程师。 主要从事多模态检索、视频检索、信息检索,大模型落地应用等领域工作。
展开
-
Shift-GCN中Shift的实现细节笔记,通过torch.index_select实现
Shift-GCN中Shift的实现细节笔记,通过torch.index_select实现 FesianXu 20201112 at UESTC前言近期在看Shift-GCN的论文[1],该网络是基于Shift卷积算子[2]在图结构数据上的延伸。在阅读源代码[3]的时候发现了其对于Non-Local Spatial Shift Graph Convolution有意思的实现方法,在这里简要记录一下。如有谬误请联系指出,转载请联系作者并注明出处,谢谢。∇\nabla∇ 联系方式:e-m.原创 2020-11-12 15:20:37 · 2130 阅读 · 3 评论 -
Shift-GCN网络论文笔记
Shift-GCN网络论文笔记 FesianXu 20201105 at UESTC前言近日笔者在阅读Shift-GCN[2]的文献,Shift-GCN是在传统的GCN的基础上,用Shift卷积算子[1]取代传统卷积算子而诞生出来的,可以用更少的参数量和计算量达到更好的模型性能,笔者感觉蛮有意思的,特在此笔记。如有谬误请联系指出,转载请联系作者并注明出处,谢谢。∇\nabla∇ 联系方式:e-mail: FesianXu@gmail.comQQ: 973926198git...原创 2020-11-08 19:10:47 · 4367 阅读 · 10 评论 -
视频人体动作捕捉技术
视频人体动作捕捉技术 FesianXu 2020/08/25 at UESTC前言人体动作捕捉技术(简称人体动捕技术)是影视游戏行业中常用的技术,其可以实现精确的人体姿态,运动捕捉,但是用于此的设备昂贵,很难在日常生活中广泛应用。视频人体动作捕捉技术指的是输入视频片段,捕捉其中场景中的人体运动信息,基于这种技术,可以从互联网中海量的视频中提取其中的人体运动姿态数据,具有很广阔的应用场景。本文打算介绍视频人体动作捕捉相关的一些工作并且笔者的一些个人看法 。 如有谬误,请联系指出,转...原创 2020-08-31 15:57:18 · 7584 阅读 · 4 评论 -
基于图结构的视频理解——组织视频序列的非线性流
基于图结构的视频理解——组织视频序列的非线性流 FesianXu 2020/08/21 at Alibaba intern前言我们在之前的博文[1]中曾经花了很长的篇幅介绍了视频理解与表征的一些内容,当然,由于篇幅原因,其实还是省略了很多内容的,特别是一些比较新的研究成果都没能进行介绍,在本文,我们继续我们的视频理解之旅,我们将在本文介绍一种基于图结构的视频理解方法,其可以组织视频序列中一些人为编辑或者镜头切换导致的非线性流,是一项非常有意思的研究。 如有谬误,请联系指出,转载请...原创 2020-08-25 02:31:48 · 844 阅读 · 0 评论 -
万字长文漫谈视频理解
漫谈视频理解 2020/4/12 FesianXu前言AI算法已经渗入到了我们生活的方方面面,无论是购物推荐,广告推送,搜索引擎还是多媒体影音娱乐,都有AI算法的影子。作为多媒体中重要的信息载体,视频的地位可以说是数一数二的,然而目前对于AI算法在视频上的应用还不够成熟,理解视频内容仍然是一个重要的问题亟待解决攻克。本文对视频理解进行一些讨论,虽然只是笔者对互联网的一些...原创 2020-04-16 09:37:52 · 7437 阅读 · 13 评论