特征图通道切分_刚哥的公开课笔记:图机器学习(五)频谱聚类

本文介绍了基于Motifs的频谱聚类方法,详细阐述了图分区的三个阶段:预处理、分解和分组。通过分析邻接矩阵、拉普拉斯矩阵及其特征向量,探讨了如何利用特征向量进行低维表示并进行聚类。文章还讨论了如何选择最佳的K值,并提出了高阶分区问题,特别是如何在加权图上应用频谱聚类来发现低基序传导率的簇。此外,展示了该方法在食物链网络和基因调控网络中的应用案例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

32c56282d1cb3850ca45800eb695dea6.png
  • 三个基本阶段:
    • 1)预处理
      • 构造图形的矩阵表示
    • 2)分解
      • 计算矩阵的特征值和特征向量
      • 根据一个或多个特征向量将每个点映射到一个较低维的表示形式
    • 3)分组
      • 根据新的表示法将点分配给两个或多个群集
  • 首先,让我们定义问题

图分区

  • 无向图G(V,E)
c9e90bf7189044874887e7de05f943a3.png
  • 双分区任务
    • 把顶点分为两个不相连的组A,B
1d2077ecc19559a1b7191f060ce1fba2.png
  • 问题
    • 如果确定分区是“好”的?
    • 如何找到这两个组?
  • 什么是一个好的分区?
    • 最大化组内连接的数量
    • 最小化组间连接的数量

图切割

  • 根据分区的“切边”来表达分区目标
  • 切割:每组中有一个端点的一组边:
62112c2c967a90eb526fd0bfe72d1727.png
ea5a7d867ae164540bdbba5859f42d22.png
  • 标准:最低限度
    • 最小化组间连接的权重
1e7d865504ae4c7d8df957c76965b47c.png

退化:

d7c34379c5a44b95855dc911f898f9d2.png
  • 问题:
    • 仅考虑外部群集连接
    • 不考虑内部集群连接
  • 判据:导电率 [Shi-Malik,’97]
    • 相对于每个组的密度,组之间的连通性
0467335855a69298a3f81bcd893487c8.png
  • 为什么使用这个标准?
    • 产生更均衡的分区
  • 我们如何有效地找到一个好的分区?
    • 问题:计算最佳电导率切分是NP-Hard问题

频谱图分区

  • A:无向G的邻接矩阵
    • Aij = 1(i,j)是边,否则为0
  • x是Rn中的向量,具有分量(x1,…,xn)
    • 将其视为G每个节点的标签/值
  • Ax 是什么意思?
de7aec384bdb77aa0c37cd566f423db2.png
  • 项yi是i的邻居的标签xj的总和
  • Ax的第j个坐标:
    • j的邻居的x值之和
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值