论文阅读:Representation Learning for Scene Graph Completion via Jointly Structural and Visual Embedding

RLSV是2018年IJCAI会议上提出的一种方法,它将TransD应用于场景图补全(SGC)。通过构建视觉特征提取模块和层次投影模块,RLSV旨在完成场景图并捕捉实体和关系的结构和视觉信息。模型通过动态映射矩阵在属性空间、关系空间和视觉空间中转换实体和关系的嵌入,以实现更准确的三元组预测。实验结果表明,RLSV在链接预测和三元组分类任务上表现出色。

RLSV (IJCAI2018)

  本文将知识图谱补全中的著名的Trans系列的算法之一TransD用到了Scene Graph Completion(简称SGC)中。顾名思义,SGC是在已经有了生成好的scene graph的基础上对其进行补充,发掘检测到的物体之间遗漏掉的关系。

  首先介绍一下TransE模型,对于知识图谱中的一个三元组(head,relation,tail),将relation看作从head到tail的翻译,即满足h+r≈t,其中h、r与t分别代表三个元素的向量形式。之后TransR对TransE进行了改进,因为每个实体其实是有多种属性的,而不同的关系考虑的是实体的不同属性,因此TransR中每个关系不仅有一个向量r表示,还有对应的映射矩阵M_r描述这个关系所处的关系空间,即需要满足hW_r+r≈tW_r。但是由于TransR的参数过多,于是又出现了TransD对其进行改进,TransD中不管是关系还是实体,都用两个向量表示,一个是普通的嵌入h、r、t,另一个则是用于得到TransR中的转换矩阵的表示,h_p、r_p和t_p(问题是如何得到这些表示)。比如对于实体h和关系r, 转换矩阵W_rh=r_p*h_p’。

  上图是RLSV的架构,主要有两个模块:用于提取视觉特征的Visual Feature Extraction Module和进行embedding的Hierachical Projection Module。
  Visual Feature Extraction Module没什么好说的,就是将bounding box

### 动态图表示中的对比学习用于金融市场预测 在金融市场的背景下,动态图表示通过捕捉随时间变化的关系来提供更丰富的数据结构。为了有效利用这些信息并进行市场预测,研究者提出了基于对比学习的方法[^1]。 #### 对比学习框架概述 对比学习是一种自监督的学习方法,在该领域内被广泛应用于图像识别等领域之外也取得了成功应用案例。对于动态网络而言,这种方法可以通过最大化同一节点不同时间戳下的相似度以及最小化不同时刻间其他节点之间的关联程度来进行训练模型参数调整优化过程[^2]。 ```python import torch from torch_geometric.nn import GCNConv, global_mean_pool as gap class ContrastiveLearningModel(torch.nn.Module): def __init__(self, input_dim, hidden_channels, out_channels): super(ContrastiveLearningModel, self).__init__() # 定义GCN层和其他必要的组件... def forward(self, x_t0, edge_index_t0, batch_t0, x_t1, edge_index_t1, batch_t1): z_t0 = ... # 计算t时刻特征向量z(t) z_t1 = ... # 同样计算下一个时间段内的特征 return z_t0, z_t1 def loss_function(z_i, z_j): temperature = 0.5 N = ... nominator = ... denominator = ... loss = -torch.log(nominator / denominator).mean() return loss ``` 此代码片段展示了如何构建一个简单的对比学习架构,并定义了一个损失函数用来衡量两个时间节点上相同实体之间表征的一致性和差异性[^3]。 #### 整合时间和静态关系 当涉及到具体实现时,除了考虑时间维度上的演化特性外,还需要关注那些相对稳定不变的因素——即所谓的“静态关系”。这可能包括但不限于公司间的长期合作关系、行业内部的竞争格局等。因此,在设计算法过程中应当充分考虑到这两方面因素的影响: - **时间序列建模**:采用循环神经网络(RNNs),长短记忆单元(LSTMs) 或者 Transformer 结构处理连续的时间步长输入; - **多尺度融合机制**:引入注意力机制或其他形式的信息聚合手段,使得模型能够更好地理解局部与全局模式之间的联系; 综上所述,通过对动态图表征学习的研究可以为金融市场分析提供更多可能性。然而值得注意的是实际操作中还需面对诸如噪声干扰等问题挑战[^4]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值