昵称已被吞噬~‘(*@﹏@*)’~-优快云博客

原创【RL+空战】学习记录02：jsbsim 结合 gymnasium 构造强化学习环境，并基于SAC算法训练可以稳定高度巡航的 Agent

【代码】【RL+空战】学习记录02：jsbsim 结合 gymnasium 构造强化学习环境，并基于SAC算法训练可以稳定高度巡航的 Agent。

2025-07-31 00:21:53 761

原创【RL+空战】学习记录01：jsbsim 仿真环境初次学习，F16 战机起飞

【代码】【RL+空战】学习记录01：jsbsim 仿真环境初次学习，F16 战机起飞。

2025-07-08 20:37:08 601 2

原创【超分辨率】基于DDIM+SwinUnet实现超分辨率

在DIV2K数据集（800张2K图像）上训练了一个8倍超分辨率模型，采用了和sr3一样的：将低分辨率图像和噪声拼接输入模型。不过没有采用sr3的直接输入噪声强度，而是继续沿用输入去燥步骤t的方法，并增加了DDPM的步数到1000（如果仅是100步的话，输出结果的噪点会比较多）。效果图放在了Github的result目录里，引入了DDIM采样（这也是使用t作为时间条件的好处），从结果看DDIM仅需采样40步效果就和DDPM采样1000步相当了。而DDIM采样1步或2步也能大体还原，不过质量不高。

2025-04-01 23:25:25 701

原创【URL】一个简单基于Gym的2D随机游走环境，用于无监督强化学习（URL）

【代码】【URL】一个简单基于Gym的2D随机游走环境，用于无监督强化学习（URL）

2025-02-02 00:52:08 169

原创【EBM】一个简单的基于能量模型（Energy Based Model）+ 朗之万动力学（Langevin Dynamics）采样生成 mnist 的试例

参考：https://github.com/jmtomczak/intro_dgm/blob/main/ebms/ebm_example.ipynb。

2025-01-31 00:24:45 369

原创【OfflineRL】CQL DDPG D4RL

【代码】【OfflineRL】CQL DDPG D4RL。

2025-01-16 23:06:03 190

原创【扩散模型】基于 DDPM 与 cifar-10 数据集生成图片的简单实现

可以隐约地看出的确有那么点意思了，可能是调参的问题吧，也可能是数据集太小了，效果不是很好。

2024-10-30 16:18:06 1718

原创 UniversalTransformer with Adaptive Computation Time(ACT)

【代码】UniversalTransformer with Adaptive Computation Time(ACT)

2024-01-03 17:19:07 533

原创【强化学习环境】TSP问题强化学习环境搭建

【代码】【强化学习环境】TSP问题强化学习环境搭建。

2023-07-03 16:56:56 440

原创【强化学习】解决gym安装Atari2600环境gym[atari,accept-rom-license] RuntimeError 无法下载Roms的问题

安装gym[accept-rom-license]时会出现安装失败的情况，因为Roms.tar.gz文件因网络问题下载不下来，而且这个包不是很好找（google上也没找到，还是在一段代码里看见的下载地址），使用一下方法替代：step1：先安装AutoROM: pip install AutoROMstep2：然后使用下载的Roms.tar.gz文件安装Atari2600: AutoROM --source-file ./Roms.tar.gz

2023-02-21 11:07:18 4266

原创【强化学习】tensorflow2.x PPO-Clip with GAE 训练 agent 玩 Atari

【强化学习】tensorflow2.x PPO-clip with GAE 训练 agent 玩 Atari

2023-02-20 10:25:18 376

原创【强化学习】基于tensorflow2.x 的 PPO2（离散动作情况）训练 CartPole-v1

【强化学习】基于tensorflow2.x 的 PPO2（离散动作情况）训练 CartPole-v1。

2023-01-18 01:24:21 1321

原创【深度强化学习实战】tensorflow2.x 训练 muzero 玩井字棋（tic-tac-toe）

【深度强化学习实战】tensorflow2.x 训练 muzero 玩井字棋（tic-tac-toe）

2022-08-04 09:14:25 762

原创【tensorflow2.x】训练 muzero 玩五子棋 (Gomoku)

tensorflow2.x 训练 muzero 玩五子棋 (Gomoku)

2022-08-01 15:49:40 2354 4

原创【tensorflow2.x】使用 wgan-gp 生成 mnist 手写数字

tensorflow2.x实现wgan生成mnist手写数字

2022-07-30 11:12:25 570

原创【tensorflow2.x】自编码器mnist

【tensorflow2.x】自编码器mnist。

2022-07-23 14:03:28 244

原创【强化学习】tensorflow2.x 构造 SoftActorCritic(SAC) 训练 LunarLanderContinuous-v2

论文地址.策略网络的损失函数不是按照原论文所写。requirements.txt:tensorflow-gpu==2.4.0gym[all]==0.21.0tensorflow_probability==0.14.0keras==2.6.0matplotlib==3.5.1from tensorflow.keras import layers, models, Input, optimizers, lossesfrom tensorflow_probability.python...

2022-04-14 23:47:24 2251 9

原创【强化学习】强化学习环境搭建，gym构造五子棋Gomoku

from gym.envs.classic_control import renderingimport numpy as npimport gymdef check(filter, state, size, filter_w, filter_h): done = False result = [] for i in range(size - filter_h + 1): for j in range(size - filter_w + 1):

2022-02-26 22:41:28 1382

原创【强化学习】MuZero 训练CartPole-v1

【深度强化学习】tensorflow2.0复现Google DeepMind版本的muzero训练CartPole-v1参考资料：[1]ColinFred. 蒙特卡洛树搜索（MCTS）代码详解【python】. 2019-03-23 23:37:09.[2]饼干Japson 深度强化学习实验室.【论文深度研读报告】MuZero算法过程详解.2021-01-19.[3]Tangarf. Muzero算法研读报告. 2020-08-31 11:40:20 .[4]带带弟弟好吗. AlphaGo版本三

2022-02-25 19:02:41 7201 18

原创【强化学习】tensorflow2.0构造DDPG训练LunarLanderContinuous-v2

from tensorflow.keras import optimizers, layers, models, lossesfrom collections import dequeimport matplotlib.pyplot as pltimport tensorflow as tfimport numpy as npimport randomimport gymimport copy# 配置GPU内存physical_devices = tf.config.experiment

2022-02-08 11:49:33 2671

原创【python】B站电影爬虫

有时我们苦于在线观看网络太慢有时我们苦于大会员即将到期却没有时间看想看的电影有时我们苦于付费电影只有三天的观看期限有时我们苦于有想多次细细品尝的电影但B站却无法下载… … -。- … …为能更好地使用我们大会员的权利，这里提供一种下载B站电影的爬虫方法一. 抓包这里直接使用浏览器的开发者工具，选择 Network，在里面找属于音频和视频的数据包（B站的音频和视频传过来的时候是分开的）一般为这几个，视频一般为 “-1-30112”，音频为 “-1-30280”，不过这个也可以根据点开后看数

2021-07-30 21:57:16 5374 1

原创【强化学习】基于tensorflow2.2实现A3C训练火箭着陆器LunarLander-v2

本来是想训练SpaceInvaders-v4来着，结果电脑train不起来，就换成LunarLander-v2了import matplotlib.pyplot as pltimport tensorflow as tfimport numpy as npimport threadingimport gymepisodes = 2000gamma = 0.9learning_rate = 1e-3num_workers = 3game = 'LunarLander-v2'state

2021-05-24 23:41:58 1103

原创【colab】白嫖Google的tpu和gpu

先打开Google云盘.在关联应用里搜索 Colaboratory 安装插件。安装完成后就可以直接在Google云盘里创建colab了。然后在 ‘代码执行程序’ 里找 ‘更改运行时类型’，可以选择实在gpu上跑还是tpu。（这里的gpu是Tesla T4，因为 gpu 的话网上资料一大把，这里接下来已 tpu 为例）可以通过一下代码将你的 Google云盘挂载到 notebook上（这里会给你一个网址，打开后是Google云盘的授权码，粘贴下来，因为这里已经授权过了所以下图中没有提示，

2021-04-14 18:35:27 2974 5

原创【强化学习】pysc2 星际争霸环境测试

如何安装就不说了Game.pyfrom pysc2.env import sc2_envclass Game_StarCraftII(object): def __init__(self, config, agents): self.game_history = { 'observations': [], 'actions': [], 'rewards': None } p

2021-03-29 17:17:47 410

原创【强化学习实战】tensorflow2.0 实现 MuZero

参考：[1]ColinFred. 蒙特卡洛树搜索（MCTS）代码详解【python】. 2019-03-23 23:37:09.[2]饼干Japson 深度强化学习实验室.【论文深度研读报告】MuZero算法过程详解.2021-01-19.[3]Tangarf. Muzero算法研读报告. 2020-08-31 11:40:20 .[4]带带弟弟好吗. AlphaGo版本三——MuZero. 2020-08-30.[5]Google原论文：Mastering Atari, Go, Chess a

2021-02-08 11:59:59 1052 2

原创【cython学习】分别使用python和cython运行斐波那契数列并计算时间

本文使用递归斐波那契数列的算法，可以直观得看出使用cython后明显的速度提升具体代码如下fib.c#include<stdio.h>#include "fib.h"long int fib(int n){ if(n == 0 || n == 1){ return 1; } else{ return (fib(n - 1) + fib(n - 2)); }}fib.hlong int fib(int n.

2020-07-24 17:10:15 494

原创 c++多指针学习

#include<iostream>using namespace std;int main(){ int i = 3; int *p1; p1 = &i; //将 i 的地址的值赋给 p1 int **p2; p2 = &p1; //将 p1 的地址的值赋给 p2 cout << *p1 << endl; //打印 p1 所指向的地址的值 cout << p1 << endl; //打印 p1

2020-07-22 17:50:51 191 1

原创【自用】vim 配置

vim 配置文件 : /etc/vim/vimrcset smarttabset tabstop=4set shiftwidth=4set expandtabset smartindentset number

2020-07-21 16:28:20 177

原创 tensorflow2.0 DenseNet121 训练 cifar100

from tensorflow.keras import layers, regularizers, Sequential, optimizersimport tensorflow as tfimport numpy as npdef regularized_padded_conv2d(*args, **kwargs): ''' 带标准化的卷积 ''' return layers.Conv2D( *args, **kwargs, padding='s

2020-06-08 21:34:44 1191 6

原创 python计算最大值

'''python 计算最大值'''def getmax(*args): return sum(map(lambda x: x**100, args))**(1/100)

2020-05-15 20:53:00 761

原创 python使用欧拉公式画圆

def euler(theta): i = (-1)**0.5 sum = 1 for a in range(1, 100 + 1): k = 1 for b in range(1, a + 1): k *= b sum += ((i*theta) ** (a)) / k return sumimport matplotlib.pyplot as pltl = [euler(i) for i in

2020-05-15 20:39:02 955

原创 tornado实现简单登陆注册功能

tornado实现简单登陆注册功能app.pyimport tornado.webimport tornado.ioloopimport hashlibimport pymysqlmysql_settings = { "host": "127.0.0.1", "user": "", "password": "", "db": "webproject",...

2020-05-05 12:48:54 556

原创【python】numpy实现线性回归

import numpy as npimport matplotlib.pyplot as pltclass linear: def __init__(self, fileName, splitBy=',', lr=1e-4, epochs=50): self.lr = lr self.epochs = epochs # 定义学习率和训练轮数...

2019-12-09 12:30:37 478

原创【python】numpy实现PCA降维

import numpy as npclass PCA: def __init__(self, fileName, splitBy=' '): self.readData = np.array([line.split(splitBy) for line in open(fileName).readlines()], dtype='float') # 读取数据为num...

2019-12-08 20:36:17 1023

原创【python】numpy实现逻辑回归

import numpy as npclass logistic: def __init__(self, fileName, splitBy='\t'): self.lr = 1e-3 self.epochs = 3000 # 定义学习率和训练轮数 data = np.array([line.split(splitBy) for li...

2019-12-08 20:12:56 594

原创【python爬虫】requests爬取BiliBili(b站)站视频

import requestsimport reimport osclass BiliBiliSpider(): def __init__(self, av_num): self.av_num = av_num self.url = 'https://www.bilibili.com/'+self.av_num self.header...

2019-11-09 21:32:26 2741 1

原创【tensorflow-DenseNet】使用DenseNet训练MNIST

DneseNet的代码：import tensorflow as tfimport tflearnclass DenseNet(object): def __init__(self,growth_rate_K,is_training,dropout_rate): self.growth_rate_K = growth_rate_K self.is_t...

2019-09-23 12:40:27 1757 3

gym[atari,accept-rom-license] Atari2600 游戏组件 Roms.tar.gz

安装gym[accept-rom-license]时会出现安装失败的情况，因为Roms.tar.gz文件因网络问题下载不下来，而且这个包不是很好找（google上也没找到，还是在一段代码里看见的下载地址），使用一下方法替代： step1：先安装AutoROM: pip install AutoROM step2：然后使用下载的Roms.tar.gz文件安装Atari2600: AutoROM --source-file ./Roms.tar.gz AutoROM github地址：https://github.com/Farama-Foundation/AutoROM

2023-02-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

gym[atari,accept-rom-license] Atari2600 游戏组件 Roms.tar.gz

知识图谱 FB15K 数据集

tensorflow-1.12.0rc0-cp36-cp36m-linux_x86_64.whl

各频率的声音(10k - 22k)HZ之间.rar

cifar10和100数据集.zip

【tensorflow-WGAN】生成二次元人物头像

MPICH2 Windows 64 位版本

空空如也