自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 PyTorch实战:基于CleanRL实现解耦的PPO世界模型(解决梯度干扰问题)

本文记录了在一个基于 CleanRL 的 PPO 算法中引入自监督“世界模型”(World Model)辅助任务的全过程。在实验中,我发现传统的“共享编码器”架构会导致严重的梯度干扰(Gradient Interference),致使模型在简单环境(CartPole-v1)中发生特征坍塌。通过采用完全解耦(Fully Decoupled)架构,成功解决了该问题,实现了高得分的任务收敛(Score: 419)与有效的表征学习。

2025-12-01 23:31:52 915

原创 洛谷P4001 狼抓兔子

题目来源:ICPC-Beijing 2006题目算法:网络流,最小割特别注意:因为这道题每条路都是双向路径,所以在建路径时需要不论正向边还是反向边都要把初始流量定义为初始值,也就是这条边的权值,也就是每一条路径只需要正反各建边一次。然后就是网络流和最小割的算法了。

2025-04-29 00:00:21 218

原创 C++中STL的使用

C++中的STL

2025-04-19 07:00:00 675

原创 关于网络流中最小割问题

网络流问题中的最小割问题

2025-04-18 22:32:17 493

原创 关于费用流(最小费用最大流)的解法

求解最小费用最大流,和求解普通的最大流的解法有些不同,要知道,每一条边的费用都等于这条边的流量和费用相乘之积,每条边上的费用也不尽相同,也就是说,在解决最小费用最大流问题时,我们可以把这个问题理解为是在解决一个最短路问题。其实就是在网络流的基础上,每一条边除了有容量以外,另外又多了一个新的性质,也就是费用,也就是说,这条边上,每流过一单位的流量,就要有多花费这样一个费用。比如一条边的容量是5,费用是10,那么流过1单位容量,费用就是1*10,流过2单位容量,费用就是2*10。

2025-02-02 09:50:21 859

原创 关于需要状态转移的网络流(分层图)的解法

一种特殊的网络流问题

2025-01-27 18:26:07 1335

原创 关于可并堆(左偏树)的另外一种实现方法

左偏树 可并堆 新算法

2025-01-23 15:41:38 651

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除