利用语义属性来进行时序知识图谱的补全

本文介绍了如何结合张量分解和超平面投影改进TKG嵌入技术,通过关系约束和正则化处理时间依赖信息,以及讨论了TransE和RESCAL模型在时序知识图谱中的应用策略。

目录

摘要部分

张量分解

超平面投影

超平面

投影

超平面投影的应用

数学表示

正则化

引言部分

TKG嵌入方法

举例

相关工作

SKG嵌入方法

评判事实合理性的评分函数模型

平移模型

TransE

TransE例子

张量分解模型

RESCAL

神经网络模型

TKG嵌入方法

外推

插值

具有语义属性的KG嵌入

方法


摘要部分

通过加强关系约束来保留TKG中暗含的语义属性。

借鉴张量分解超平面投影的思想设计与时间戳关联的关系约束。

采用合适的正则化方案来适应特定的关系约束。

张量分解

张量分解(Tensor Decomposition)是一种数学技术,用于将高维数据结构(称为张量)分解为多个低维组件。张量是一个多维数组,可以看作是矩阵(二维数组)的高维推广。张量分解的目的是找到原始数据的紧凑表示,通常用于数据压缩、降维、特征提取和模式识别等。

常见的张量分解的方法:

  1. CP分解(Candecomp/Parafac Decomposition):CP分解将张量分解为一组秩-1张量的和。对于三维张量,CP分解可以表示为三个矩阵的外积和。

  2. Tucker分解:Tucker分解将张量分解为一个核心张量和一组矩阵的乘积。与CP分解不同,Tucker分解允许核心张量具有不同的秩。

  3. 张量奇异值分解(Tensor SVD):这是奇异值分解(SVD)的张量推广,用于将张量分解为一组正交矩阵和一组奇异值。

  4. 分层Tucker分解(Hierarchical Tucker Decomposition):这种方法采用分层结构来分解张量,允许更灵活和可扩展的表示。

超平面投影

超平面

超平面是一个维度比包围空间低一维的子空间。例如,在三维空间中,超平面是一个平面;在二维空间中,超平面是一条直线。

投影

投影是将一个点或一组点从一个空间映射到另一个空间的过程。在超平面投影的情况下,这意味着将高维空间中的点映射到一个低维子空间上。

超平面投影的应用

超平面投影在许多领域都有应用,包括:

  1. 降维:通过将数据投影到低维子空间,可以减少数据的复杂性和维度,同时保留重要的特征和结构。

  2. 分类和回归:在支持向量机(SVM)等机器学习算法中,超平面用作决策边界,将不同类别的数据分开。

  3. 数据可视化:通过将高维数据投影到二维或三维空间,可以更容易地可视化和理解数据的结构和关系。

数学表示

超平面可以通过线性方程来表示:

a_1x_1 + a_2x_2 + \ldots + a_nx_n = b

其中 (a_1, a_2, \ldots, a_n)是超平面的法向量,( b )是常数,(x_1, x_2, \ldots, x_n) 是空间中的点。

投影点可以通过以下公式计算:

P = Q - \frac{​{(Q - P_0) \cdot N}}{​{N \cdot N}} \cdot N

其中 ( P )是投影点,( Q )是原始点,( P_0 ) 是超平面上的任意点,( N )是超平面的法向量。

超平面投影是一种强大的数学工具,用于降维、分类、回归和数据可视化。它通过将高维空间中的点投影到低维子空间来实现这些目的,从而提供了一种有效的方式来分析和解释复杂数据集。

正则化

正则化(Regularization)是机器学习和统计建模中的一个技术,用于防止模型过拟合。过拟合是指模型在训练数据上表现得非常好,但在未见过的测试数据上表现较差的现象。正则化通过向模型的目标函数(通常是损失函数)添加一个惩罚项来实现。

正则化的基本思想是限制模型的复杂度,使其不会过于依赖训练数据中的噪声或异常值。通过引入一些形式的惩罚,正则化鼓励模型选择较小的参数值,从而使模型更简单、更平滑。

常见的正则化方法有:

  • L1正则化:也称为Lasso正则化,通过在损失函数中添加参数的绝对值之和作为惩罚项。这通常会导致某些参数精确为
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值