HIN 异构信息网络(Heterogeneous Information Network)

本文介绍了信息网络的基本概念,包括信息网络的表示方法、异构/同构信息网络的区别、网络模式的定义及其子图——元图的概念。同时,还详细阐述了元路径的概念及其在语义挖掘中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

信息网络(Information Network)

信息网络可以用一个有向图G = (V, E) 来表示,其中V代表 Object,E代表 Edge。并且用映射函数 ϕ : V → A 来表示每一个object v ∈ V 属于object类型集合A: ϕ(v) ∈ A,用映射函数ψ : E → R.表示每条边 e ∈ E 属于边的类型集合R: ψ(e) ∈ R。如下图1所示:

图1

注:如果两条边连接的起始节点和终止节点的type都相同,则这两条边是同一种类型。

异构/同构信息网络(Heterogeneous/homogeneous information Network)

如果|A| > 1 或者 |R| > 1 ,则该信息网络为异构信息网络,或简称为异构网络,否则为同构网络。例如图2即为一个典型的网络实例(network instance,following 某种 network schema的信息网络可以称为这种网络模式的网络实例)from DBLP

图2

网络模式(Network schema)

异构信息网络(G = (V, E)with ϕ(v) ∈ A 并且 ψ(e) ∈ R)的network schema TG = (A, R),要指定objects和links的类型约束,就是这种约束使得异构网络变为半结构化。网络模式如图3所示,图2是图3的网络实例。

图3

元路径(Meta path)

元路径P是定义在网络模式TG = (A, R)上的,如 A1RA2RA3...RAl+1 表示了从 A1 Al+1 的复杂的关系, R=R1R2R3Rl 。元路径P的长度即为关系R的个数。

注:

  1. 在不引起歧义的情况下也可以直接用object,type来表示元路径。 P=(A1A2..Al+1) ,例如 AwritingPwrittenbyP :可以直接表示为 APA
  2. P1=(A1A2A3..Al)P2=(B1B2B3..Bk)P=(P1P2)=(A1A2A3..AlB1B2B3..Bk)
  3. 形如APA,APVPA,APTPA等, P=P1 的,则此元路径为对称的。
  4. 不同元路径代表着不同的物理意义,元路径所所蕴含的丰富的语义特征,是HIN的一大非常重要的特征,所以现在非常promising的一个方向语义挖掘(semantic mining)大部 分还是在针对元路径进行研究。

元图(Meta graph)

网络模式(Network schema)的子图
图4

参考文献

  1. http://home.cse.ust.hk/~yqsong/papers/2017-HIN-Metagraph.pdf
  2. http://blog.youkuaiyun.com/u013527419/article/details/50968809
### 异构信息网络嵌入在推荐系统中的应用 #### 实现方法 异构信息网络HIN)嵌入能够捕捉不同类型实体之间的复杂关系,从而提高推荐系统的性能。为了实现这一点,通常采用基于元路径的方法来构建和利用HIN。 1. **定义元路径** 元路径是指连接两个对象类型的特定序列,在HIN中可以用来表达不同种类的对象间的关系模式。例如,在电影数据库里,“User-Movie-Actor”就是一个有效的元路径[^1]。 2. **特征提取** 利用所选的元路径进行特征抽取,形成节点表示向量。此过程可以通过多种方式完成,比如随机游走、矩阵运算或者更先进的图神经网络(GNN)。对于每一对用户-物品组合,依据预设好的一组或多组元路径生成对应的特征向量作为输入给后续的学习模型。 3. **相似度计算** 基于上述获得的低维稠密向量表征,可运用余弦距离或其他合适的测度函数衡量任意两节点间的语义关联程度。这种量化后的亲疏关系有助于预测潜在的兴趣匹配情况,进而指导个性化推荐列表排序。 4. **训练与评估** 构造好样本集之后便能开展监督式或半监督式的机器学习任务了。常见的做法是以部分已知评分记录为正负例标签来进行分类器调参;而测试阶段则依赖交叉验证等手段确保泛化误差处于可控范围之内。 ```python import numpy as np from sklearn.metrics.pairwise import cosine_similarity def calculate_similarity(embeddings): """Calculate the similarity between all pairs of embeddings.""" sim_matrix = cosine_similarity(embeddings) return sim_matrix ``` #### 应用案例 在一个真实的社交平台场景下,假设存在大量用户的点赞行为构成了一张复杂的HIN。这里不仅包含了人与人的关注关系,还有他们共同参与的话题群组以及发表过的文章评论等内容。借助精心挑选的一系列有意义的元路径,如“Person-Paper-Author”,系统得以充分理解个体兴趣偏好并据此给出精准的内容推送建议。 另一个典型例子来自电子商务领域。商家希望根据顾客浏览历史及购买经历建立高效的营销策略。此时引入商品类别、品牌归属乃至评价反馈等多个维度的信息源组建起丰富的HIN框架,则可通过分析其中蕴含的价值链路帮助识别出那些最有可能促成交易转化的目标客户群体。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值