34、深度强化学习：核心概念与前沿探索

落叶知秋263

于 2025-09-02 12:54:29 发布

阅读量30

点赞数

CC 4.0 BY-SA版权

分类专栏：深度强化学习实战指南文章标签：深度强化学习图神经网络马尔可夫决策过程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/ansible6ops/article/details/151169638

深度强化学习实战指南专栏收录该内容

36 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

深度强化学习：核心概念与前沿探索

1. 图神经网络与相关基础概念

1.1 图神经网络简介

图神经网络是用于处理图结构数据的机器学习模型。图是由一组对象（节点）和对象之间的关系（边）组成的数据结构。例如，社交网络就是一种自然的图类型，其中节点代表个人，节点之间的边代表友谊关系。

1.2 邻接矩阵

邻接矩阵是一个维度为 $A:N × N$ 的矩阵，其中 $N$ 是图中节点的数量，它编码了每对节点之间的连接性。

1.3 消息传递算法

消息传递是一种通过迭代聚合节点邻居信息来计算节点特征更新的算法。

1.4 归纳偏置

归纳偏置是我们对一组数据的先验信息，用于约束模型学习特定类型的模式。例如，在某些情况下会采用关系归纳偏置。

1.5 不变性和等变性

当函数 $f$ 满足 $f(g(x)) = f(x)$ 时，我们称函数 $f$ 对变换 $g$ 具有不变性。
当函数 $f$ 满足 $f(g(x)) = g(f(x))$ 时，我们称函数 $f$ 对变换 $g$ 具有等变性。

1.6 注意力模型

注意力模型旨在通过迫使模型只“关注”输入数据的一个子集来提高机器学习模型的可解释性和性能。通过检查模型学习关注的内容，我们可以更好地了解它是如何做出决策的。

1.7 自注意力模型

自注意力模型建模输入中对象（或节点）之间的注意力，而不仅仅是模型关注输入的不同部分。这自然会导致一种图神经网络形式，因为注意力权重

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。