【几何深度学习 Geometric Deep Learning】Graph Transformer

最新推荐文章于 2025-11-30 23:47:27 发布

VectorShift

最新推荐文章于 2025-11-30 23:47:27 发布

阅读量88

点赞数

CC 4.0 BY-SA版权

分类专栏：人工智能技术白皮书文章标签：深度学习计算机视觉神经网络算法

本文链接：https://blog.youkuaiyun.com/VectorShift/article/details/151066668

人工智能技术白皮书专栏收录该内容

156 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

Graph Transformer

从自注意力到图结构的推广

核心思想

邻域注意力（Neighborhood‑Attention）：仅在节点自己的局部子图里进行交互，避免全图 O(N²) 的开销。

位置编码（Positional Encoding）：为每条边或每个节点提供可区分的位置信息，使得 Transformer 能保留图的拓扑结构。常见做法包括 distance‑based (如 Shortest‑Path Distance, Edge‐Type) 与 random‑walk 方式。

下面给出一个 完整、可运行 的 PyTorch 实现，涵盖

数据准备（PyG style）
邻域注意力层 GraphAttentionLayer
距离/随机游走位置编码 PosEnc
基于上述两块的 Graph Transformer 模型 GraphTransformer
训练循环示例

目标：让读者能直接跑一遍，看到梯度消失、收敛速度等常见挑战，并通过代码中的注释快速定位优化点。<

了解本专栏

订阅专栏解锁全文

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

VectorShift

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

【几何深度学习Geometric Deep Learning】跨模态几何融合

VectorShift的博客

09-01

103

跨模态几何融合正成为多感知系统的核心技术之一。通过将图、点云与序列等非欧式数据统一映射到共享嵌入空间，并利用异构图 + Transformer 的联合框架，可以在保持各自几何不变性的前提下，实现强大的跨模态交互和推理能力。未来的研究应聚焦于更高效的投影方法、更鲁棒的对齐策略以及可解释性与实时部署之间的平衡，以推动 CGF 在自动驾驶、机器人感知、生物信息学等领域的深入应用。

几何深度学习（Geometric Deep Learning）技术

吴建明wujianming_110117

03-10

1494

几何深度学习（Geometric Deep Learning）技术 几何深度学习综述从论文Geometric Deep Learning: Grids, Groups, Graphs, Geodesics, and Gauges，了解一下几何深度学习。 https://geometricdeeplearning.com关于这个主题，研究者甚至建了一个网站。 几何深度学习——Geometric Deep Learning 几何深度学习，从对称性和不变性的角度，尝试对一大类机器学习问题进行统一。因此，几何

参与评论您还未登录，请先登录后发表或查看评论

Graph图和Geometric Deep Learning几何深度学习的Foundation Models基础模型

数据派THU

08-10

631

本文约10000字，建议阅读10+分钟本文为你介绍图 FM及其使用的示例。语言、视觉和音频的Foundation Models基础模型已成为 2024 年机器学习的主要研究主题之一，而针对图结构数据的 FMs 则有些落后。在这篇文章中，我们认为图 FM 的时代已经开始，并提供了一些如何在今天使用它们的示例。图形和几何深度学习中新兴基础模型的时间线。什么是图形基础模型以及如何构建它们？由于对于什么...

【几何深度学习（Geometric Deep Learning）】统一框架：GNN 与 GDL 的关系

VectorShift的博客

09-01

统一框架：传统 DL 的卷积/循环/自注意力在 GDL 中被映射为图卷积、交互式注意力和局部 Transformer，核心归纳偏置从平移变为图的自同构。理论深度：GCN 基于谱域拉普拉斯正则化；GAT 通过可学习的注意力实现节点间加权聚合；Graph Transformer 在保持全局信息的同时，利用窗口机制控制稀疏性。对称性与可解释性：对称群是 GDL 的核心归纳偏置；网络结构直接对应物理/几何约束，使模型更易于解释和调优。未来方向多模态图学习：融合图、时间序列、文本等信息；可微分对称性学习。

【几何深度学习（Geometric Deep Learning）】物理对称性嵌入网络

VectorShift的博客

09-01

一个的完整示例，演示如何把物理对称性（这里是 3‑D 空间中的 SO(3) 旋转）嵌入到深度网络里。我们使用的是e3nn（一个专门为 SE(3)-equivariant 网络提供的 PyTorch 生态），并结合来处理分子图数据。

Geometric deep learning: going beyond Euclidean data译文

weixin_42037651的博客

09-12

2375

Geometric deep learning: going beyond Euclidean data（几何深度学习：超越欧几里得数据）摘要：许多科学领域研究具有非欧几里德空间的底层结构的数据。一些例子包括计算社会科学中的社会网络、通信中的传感器网络、脑成像中的功能网络、遗传学中的调节网络以及计算机图形学中的网状表面。在许多应用中，此类几何数据庞大而复杂（在社交网络中，规模达数十亿），是机器学习技术的自然目标。特别是，我们希望使用深度神经网络，它最近被证明是解决计算机视觉、自然语言处理和音频分析等广泛

几何深度学习（Geometric Deep Learning）—— 原理与核心算法

VectorShift的博客

09-01

384

主要内容包括：几何深度学习的概念框架、对称性与不变性的数学基础、卷积、注意力及图网络中的群理论实现，以及常见模型（GCN、GAT、SAGE、Graph Transformer、PointNet++ 等）的核心原理。全文以**“从先验到归纳”**的视角展开，帮助读者把握如何将物理对称性或几何约束嵌入网络结构。

《Deep Learning With Python second edition》英文版读书笔记：第十一章DL for text: NLP、Transformer、Seq2Seq

阿正的梦工坊

03-18

6504

python深度学习第二版读书笔记

深度学习的几何基础

deephub

04-29

4644

几何深度学习是从对称性和不变性的角度对广泛的ML问题进行几何统一的尝试。这些原理不仅是卷积神经网络的突破性性能和图神经网络的近期成功的基础，而且还为构造新型的特定于问题的归纳偏差提供了一种有原则的方法。此文章是与Joan Bruna，Taco Cohen和PetarVeličković共同撰写的，并基于MM Bronstein，J。Bruna，T。Cohen和P.Veličković的新论文 Deep Learning: Grids, Groups, Graphs, Geodesics, and Gau

【民族服饰识别系统】Python+TensorFlow+Vue3+Django+人工智能+深度学习+卷积网络+resnet50算法

子午的博客

11-30

452

民族服饰识别，民族服饰智能识别与分析系统基于TensorFlow框架，采用卷积神经网络（CNN）算法构建而成。系统在收集了回族、汉族、满族、苗族四类典型民族服饰图像数据集的基础上，通过多轮迭代训练，最终生成高精度识别模型，并配合Web可视化平台实现便捷交互。前端后端：Django算法：TensorFlow、卷积神经网络算法具体功能系统分为管理员和用户两个角色，登录后根据角色显示其可访问的页面模块。登录系统后可发布、查看、编辑文章，创建文章功能中集成了markdown编辑器，可对文章进行编辑。

深度学习实战（基于pytroch）系列（四十一）长短期记忆（LSTM）pytorch简洁实现

echo的博客

11-29

823

本文介绍了使用PyTorch简洁实现长短期记忆网络(LSTM)语言模型的方法。首先读取周杰伦歌词数据集并进行预处理，然后定义包含LSTM层和全连接层的RNN模型类，其中LSTM需要同时处理隐藏状态和细胞状态。文章详细展示了模型初始化、预测函数实现以及训练过程，包括梯度裁剪和数据迭代器设计。通过对比手动实现，突出了PyTorch框架在简化LSTM实现方面的优势，为自然语言处理任务提供了高效的解决方案。

深度学习实战（基于pytroch）系列（四十）长短期记忆（LSTM）从零开始实现

echo的博客

11-28

1427

LSTM（长短期记忆网络）是一种改进的循环神经网络，通过引入输入门、遗忘门和输出门三个控制单元，以及记忆细胞结构，有效解决了传统RNN的梯度消失问题。其核心计算包括：三个门控单元通过sigmoid函数调节信息流动，候选记忆细胞使用tanh函数生成，最终记忆细胞由遗忘门和输入门共同决定。实验使用周杰伦歌词数据集进行训练，从零实现了LSTM模型的参数初始化和前向传播过程，包括状态初始化、门控计算和隐藏状态更新。该结构能更好地捕捉长距离依赖关系，适用于序列建模任务。

深度学习：从技术本质到未来图景的全面解析

m0_71934846的博客

11-29

1010

摘要 深度学习作为人工智能的核心技术，通过多层神经网络模拟人脑机制，实现端到端学习，广泛应用于图像识别、自然语言处理、自动驾驶等领域。其核心技术包括卷积神经网络（CNN）、循环神经网络（RNN）以及优化算法与损失函数。尽管深度学习已深刻改变产业模式，但仍面临数据依赖、可解释性差、算力消耗等挑战。未来发展趋势包括自监督学习、可解释AI、多模态学习及通用人工智能（AGI）。深度学习不仅推动技术革新，也对个人职业发展和社会数字化进程产生深远影响。

深度学习实战（基于pytroch）系列（四十四）优化与深度学习

echo的博客

11-30

915

本文探讨了优化与深度学习的关系及优化在深度学习中的挑战。优化算法通过最小化训练误差来降低损失函数值，而深度学习更关注降低泛化误差。文中重点分析了深度学习中常见的两个优化挑战：局部最小值和鞍点。通过数学函数示例和可视化图表，展示了这些特征点的特性，并指出在高维参数空间中，鞍点比局部最小值更为常见。最后强调虽然全局最优解难以获得，但现有优化算法已能有效训练深度学习模型。

Python连接云端Linux服务器进行远程（后端开发/深度学习）时候的注意事项

少年何妨梦摘星，敢挽桑弓射玉衡。他时若遂凌云志，敢笑黄巢不丈夫。

11-29

754

深度学习助力图像增强：多算法与PyTorch复现

2508_94252591的博客

11-29

644

深度学习图像低光照增强算法低照度增强3DLUT,DeepUPT,DeepLPF,RetinexNet,Zero-DCE,EnlightenGAN,RetinexFormer等图像调色增强算法HDRNet,StarEnhancer,CSRNet等水下增强算法UWGAN,UIEGAN等pytorch架构复现，有代码和benchmark数据集在图像处理领域，针对不同场景和需求，有着各种各样的深度学习算法。

DAY 43 复习日

Petrichor_H_的博客

11-30

kaggle找到一个图像数据集，用cnn网络进行训练并且用grad-cam做可视化。进阶：并拆分成多个文件。

基于深度学习的手写数学公式识别与计算系统设计与实现