PSO算法（优化与探索四*DDPG与GAN）_ddpg可以采用pso算法进行更新吗-优快云博客

本文链接：https://blog.youkuaiyun.com/FUTEROX/article/details/125434777

本文讨论了基于强化学习的PSO优化方法，分析了DQN和DDPG在解决参数优化问题上的局限性，并提出了GAN在建模优化中的优势。作者通过对比DQN和DDPG的机制，指出DDPG更适合直接生成一组解，而GAN的评委网络可以作为评价标准。文章最后提及使用GAN建模的挑战在于确定判断器的设计。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

前言
版权
2022.6.23
DDPG 神经网络
GAN神经网络
- 异同
使用GAN 建模
总结

前言

今天怎么说干的事情不多，一方面是因为看了一篇论文，关于RLPSO的是今年6月3日出来的新的文章《Reinforcement learning based parameters adaption method for particleswarm optimization》
里面提到了不少关于PSO的优化，然后提出了一种基于强化学习的PSO，通过预训练一个神经网络，输入当前的粒子状态，得到一组参数 w,c1,c2。然后做出调整，因为粒子群，包括遗传，EDA 等等对参数的设置是比较敏感，所以你懂的，用深度学习去搞。所以我就想了，能不能在原来的基础上，我也那么干？

然后发现我欠考虑了，写到一半发现方向错了。
一开始，我是打算使用QLearning直接做，因为论文提到的DDPG也是ＱＬｅａｒn在线学习嘛。
然后是打算设计动作的，让w,c1,c2 往一定的步长运动，运动方向由QLearn决定，但是这里有涉及到步长的设置，等等，所以发现不如直接得到参数w c1 c2那样一来还不如用DDPG，而且一开始我是使用Qlearning不用神经网络来做的，但是后面发现，智能算法的迭代次数过多就直接炸了，还是要用神经网络也就是DQN，后面也是代码写到一般发现不行，还是要改为DDPG。

但是仔细看看了论文，以及DDPG以后，我陷入了沉思，于是仔细对比策略，发现GAN好像更容易建模去优化PSO。