此为原创笔记,如需转载请注明
时空图和结构化RNN: st-graph and structural-RNN
目录
时空图和结构化RNN: st-graph and structural-RNN
本论文讲解的的是如何通过人的特征(人体姿态特征)、物的特征(物的功能特征等)以及人和静态物体的关系(相对位置关系特征等),来判断每个时间点t=1,2,3,...人所做的动作。
一、时空图(Spatio-temporal graph)
1.概念
(以 人、碗、微波炉的例子进行讲解)

图1:从st图到S-RNN的示例问题。(底部)显示了一个示例活动(人体微波食品)。对这些问题进行建模需要空间和时间两方面的推理。(中)捕捉人与物体之间的时空交互作用的St-graph。(顶部)我们的结构RNN体系结构的示意图,自动从st图形派生。它以一种丰富而可伸缩的方式捕捉st-graph的结构和交互作用。
时空图(st-graph):是一种用于刻画多个物体之间在空间与时间维度上交互的图结构。

简化的时空图
时空图三要素:节点,时空边(spatio-temporal edge)和时间边(temporal edge)
其中v∈V,
(1)节点V:人和物体 例子中为人、碗、微波炉
(2)时空边集:同一时间,人-人,人-物之间的关系 例子中为边(人,碗),边(人,微波炉),边(碗,微波炉)
(3)时间边集:同一节点在相邻时间步上的关系 例子中为边(人,人),边(碗,碗),边(微波炉,微波炉)
nodes的种类:human、object
edges的种类:human-human(self)、human-object、object-object(self)、object-object
2.时空图展开
按时间展开的时空图: 
其中, 给定时间步t处的节点与无向时空边相连,相邻时间步上的节点(例如时间t处的节点u和时刻t+1处的节点v)与无向时间边
相连。
:
,
,
:表示节点的特征向量 ,如人/物的姿态:人的活动特征和物体的功能特征(affordance)
:
,

本文介绍了一种新的深度学习框架Structural-RNN,用于建模和预测人类活动。该框架利用时空图(st-graph)捕捉人与物体之间的交互,并将其转换为二分图结构,便于RNN处理。通过节点和边的因子共享,模型能有效处理不同数量的对象。
最低0.47元/天 解锁文章
919

被折叠的 条评论
为什么被折叠?



