- 博客(5)
- 收藏
- 关注
原创 同构图注意力网络的嵌入过程
符号维度说明xix_ixiRFRF输入节点特征WWWRF′×FRF′×F可训练线性变换hiWxih_i = Wx_ihiWxiRF′RF′节点的嵌入表示hi∥hjhi∥hjR2F′R2F′拼接后的特征aaaR2F′R2F′可训练的注意力向量eije_{ij}eijR\mathbb{R}R未归一化注意力系数(标量)αijαijR\mathbb{R}
2025-09-15 17:06:57
708
原创 强化学习中trajectory,episode和rollout的区别
Trajectory 是一个更通用的术语,表示任意时间段的交互序列。 Episode 强调从开始到结束的完整交互过程。 Rollout 强调采样过程,既可以是完整的 episode,也可以是部分 trajectory。
2025-01-03 15:45:55
641
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅