- 博客(35)
- 资源 (5)
- 收藏
- 关注
原创 【超分辨率】基于DDIM+SwinUnet实现超分辨率
在DIV2K数据集(800张2K图像)上训练了一个8倍超分辨率模型,采用了和sr3一样的:将低分辨率图像和噪声拼接输入模型。不过没有采用sr3的直接输入噪声强度,而是继续沿用输入去燥步骤t的方法,并增加了DDPM的步数到1000(如果仅是100步的话,输出结果的噪点会比较多)。效果图放在了Github的result目录里,引入了DDIM采样(这也是使用t作为时间条件的好处),从结果看DDIM仅需采样40步效果就和DDPM采样1000步相当了。而DDIM采样1步或2步也能大体还原,不过质量不高。
2025-04-01 23:25:25
496
原创 【URL】一个简单基于Gym的2D随机游走环境,用于无监督强化学习(URL)
【代码】【URL】一个简单基于Gym的2D随机游走环境,用于无监督强化学习(URL)
2025-02-02 00:52:08
115
原创 【EBM】一个简单的基于能量模型(Energy Based Model)+ 朗之万动力学(Langevin Dynamics)采样生成 mnist 的试例
参考:https://github.com/jmtomczak/intro_dgm/blob/main/ebms/ebm_example.ipynb。
2025-01-31 00:24:45
164
原创 【扩散模型】基于 DDPM 与 cifar-10 数据集生成图片的简单实现
可以隐约地看出的确有那么点意思了,可能是调参的问题吧,也可能是数据集太小了,效果不是很好。
2024-10-30 16:18:06
1244
原创 UniversalTransformer with Adaptive Computation Time(ACT)
【代码】UniversalTransformer with Adaptive Computation Time(ACT)
2024-01-03 17:19:07
479
原创 【强化学习】解决gym安装Atari2600环境gym[atari,accept-rom-license] RuntimeError 无法下载Roms的问题
安装gym[accept-rom-license]时会出现安装失败的情况,因为Roms.tar.gz文件因网络问题下载不下来,而且这个包不是很好找(google上也没找到,还是在一段代码里看见的下载地址),使用一下方法替代:step1:先安装AutoROM: pip install AutoROMstep2:然后使用下载的Roms.tar.gz文件安装Atari2600: AutoROM --source-file ./Roms.tar.gz
2023-02-21 11:07:18
3787
原创 【强化学习】tensorflow2.x PPO-Clip with GAE 训练 agent 玩 Atari
【强化学习】tensorflow2.x PPO-clip with GAE 训练 agent 玩 Atari
2023-02-20 10:25:18
310
原创 【强化学习】基于tensorflow2.x 的 PPO2(离散动作情况) 训练 CartPole-v1
【强化学习】基于tensorflow2.x 的 PPO2(离散动作情况) 训练 CartPole-v1。
2023-01-18 01:24:21
1228
原创 【深度强化学习实战】tensorflow2.x 训练 muzero 玩井字棋(tic-tac-toe)
【深度强化学习实战】tensorflow2.x 训练 muzero 玩井字棋(tic-tac-toe)
2022-08-04 09:14:25
691
原创 【tensorflow2.x】训练 muzero 玩五子棋 (Gomoku)
tensorflow2.x 训练 muzero 玩五子棋 (Gomoku)
2022-08-01 15:49:40
2223
4
原创 【强化学习】tensorflow2.x 构造 SoftActorCritic(SAC) 训练 LunarLanderContinuous-v2
论文地址.策略网络的损失函数不是按照原论文所写。requirements.txt:tensorflow-gpu==2.4.0gym[all]==0.21.0tensorflow_probability==0.14.0keras==2.6.0matplotlib==3.5.1from tensorflow.keras import layers, models, Input, optimizers, lossesfrom tensorflow_probability.python...
2022-04-14 23:47:24
2130
9
原创 【强化学习】强化学习环境搭建,gym构造五子棋Gomoku
from gym.envs.classic_control import renderingimport numpy as npimport gymdef check(filter, state, size, filter_w, filter_h): done = False result = [] for i in range(size - filter_h + 1): for j in range(size - filter_w + 1):
2022-02-26 22:41:28
1248
原创 【强化学习】MuZero 训练CartPole-v1
【深度强化学习】tensorflow2.0复现Google DeepMind版本的muzero训练CartPole-v1参考资料:[1]ColinFred. 蒙特卡洛树搜索(MCTS)代码详解【python】. 2019-03-23 23:37:09.[2]饼干Japson 深度强化学习实验室.【论文深度研读报告】MuZero算法过程详解.2021-01-19.[3]Tangarf. Muzero算法研读报告. 2020-08-31 11:40:20 .[4]带带弟弟好吗. AlphaGo版本三
2022-02-25 19:02:41
7060
18
原创 【强化学习】tensorflow2.0构造DDPG训练LunarLanderContinuous-v2
from tensorflow.keras import optimizers, layers, models, lossesfrom collections import dequeimport matplotlib.pyplot as pltimport tensorflow as tfimport numpy as npimport randomimport gymimport copy# 配置GPU内存physical_devices = tf.config.experiment
2022-02-08 11:49:33
2627
原创 【python】B站电影爬虫
有时我们苦于在线观看网络太慢有时我们苦于大会员即将到期却没有时间看想看的电影有时我们苦于付费电影只有三天的观看期限有时我们苦于有想多次细细品尝的电影但B站却无法下载… … -。- … …为能更好地使用我们大会员的权利,这里提供一种下载B站电影的爬虫方法一. 抓包这里直接使用浏览器的开发者工具,选择 Network,在里面找属于音频和视频的数据包(B站的音频和视频传过来的时候是分开的)一般为这几个,视频一般为 “-1-30112”,音频为 “-1-30280”,不过这个也可以根据点开后看数
2021-07-30 21:57:16
4692
1
原创 【强化学习】基于tensorflow2.2实现A3C训练火箭着陆器LunarLander-v2
本来是想训练SpaceInvaders-v4来着,结果电脑train不起来,就换成LunarLander-v2了import matplotlib.pyplot as pltimport tensorflow as tfimport numpy as npimport threadingimport gymepisodes = 2000gamma = 0.9learning_rate = 1e-3num_workers = 3game = 'LunarLander-v2'state
2021-05-24 23:41:58
1034
原创 【colab】白嫖Google的tpu和gpu
先打开Google云盘.在关联应用里搜索 Colaboratory 安装插件。安装完成后就可以直接在Google云盘里创建colab了。然后在 ‘代码执行程序’ 里找 ‘更改运行时类型’, 可以选择实在gpu上跑还是tpu。(这里的gpu是Tesla T4,因为 gpu 的话网上资料一大把,这里接下来已 tpu 为例)可以通过一下代码将你的 Google云盘挂载到 notebook上(这里会给你一个网址,打开后是Google云盘的授权码,粘贴下来,因为这里已经授权过了所以下图中没有提示,
2021-04-14 18:35:27
2523
5
原创 【强化学习】pysc2 星际争霸环境测试
如何安装就不说了Game.pyfrom pysc2.env import sc2_envclass Game_StarCraftII(object): def __init__(self, config, agents): self.game_history = { 'observations': [], 'actions': [], 'rewards': None } p
2021-03-29 17:17:47
351
原创 【强化学习实战】tensorflow2.0 实现 MuZero
参考:[1]ColinFred. 蒙特卡洛树搜索(MCTS)代码详解【python】. 2019-03-23 23:37:09.[2]饼干Japson 深度强化学习实验室.【论文深度研读报告】MuZero算法过程详解.2021-01-19.[3]Tangarf. Muzero算法研读报告. 2020-08-31 11:40:20 .[4]带带弟弟好吗. AlphaGo版本三——MuZero. 2020-08-30.[5]Google原论文:Mastering Atari, Go, Chess a
2021-02-08 11:59:59
988
2
原创 【cython学习】分别使用python和cython运行斐波那契数列并计算时间
本文使用递归斐波那契数列的算法,可以直观得看出使用cython后明显的速度提升具体代码如下fib.c#include<stdio.h>#include "fib.h"long int fib(int n){ if(n == 0 || n == 1){ return 1; } else{ return (fib(n - 1) + fib(n - 2)); }}fib.hlong int fib(int n.
2020-07-24 17:10:15
456
原创 c++多指针学习
#include<iostream>using namespace std;int main(){ int i = 3; int *p1; p1 = &i; //将 i 的地址的值赋给 p1 int **p2; p2 = &p1; //将 p1 的地址的值赋给 p2 cout << *p1 << endl; //打印 p1 所指向的地址的值 cout << p1 << endl; //打印 p1
2020-07-22 17:50:51
173
1
原创 【自用】vim 配置
vim 配置文件 : /etc/vim/vimrcset smarttabset tabstop=4set shiftwidth=4set expandtabset smartindentset number
2020-07-21 16:28:20
153
原创 tensorflow2.0 DenseNet121 训练 cifar100
from tensorflow.keras import layers, regularizers, Sequential, optimizersimport tensorflow as tfimport numpy as npdef regularized_padded_conv2d(*args, **kwargs): ''' 带标准化的卷积 ''' return layers.Conv2D( *args, **kwargs, padding='s
2020-06-08 21:34:44
1148
6
原创 python计算最大值
'''python 计算最大值'''def getmax(*args): return sum(map(lambda x: x**100, args))**(1/100)
2020-05-15 20:53:00
737
原创 python使用欧拉公式画圆
def euler(theta): i = (-1)**0.5 sum = 1 for a in range(1, 100 + 1): k = 1 for b in range(1, a + 1): k *= b sum += ((i*theta) ** (a)) / k return sumimport matplotlib.pyplot as pltl = [euler(i) for i in
2020-05-15 20:39:02
926
原创 tornado实现简单登陆注册功能
tornado实现简单登陆注册功能app.pyimport tornado.webimport tornado.ioloopimport hashlibimport pymysqlmysql_settings = { "host": "127.0.0.1", "user": "", "password": "", "db": "webproject",...
2020-05-05 12:48:54
520
原创 【python】numpy实现线性回归
import numpy as npimport matplotlib.pyplot as pltclass linear: def __init__(self, fileName, splitBy=',', lr=1e-4, epochs=50): self.lr = lr self.epochs = epochs # 定义学习率和训练轮数...
2019-12-09 12:30:37
450
原创 【python】numpy实现PCA降维
import numpy as npclass PCA: def __init__(self, fileName, splitBy=' '): self.readData = np.array([line.split(splitBy) for line in open(fileName).readlines()], dtype='float') # 读取数据为num...
2019-12-08 20:36:17
990
原创 【python】numpy实现逻辑回归
import numpy as npclass logistic: def __init__(self, fileName, splitBy='\t'): self.lr = 1e-3 self.epochs = 3000 # 定义学习率和训练轮数 data = np.array([line.split(splitBy) for li...
2019-12-08 20:12:56
555
原创 【python爬虫】requests爬取BiliBili(b站)站视频
import requestsimport reimport osclass BiliBiliSpider(): def __init__(self, av_num): self.av_num = av_num self.url = 'https://www.bilibili.com/'+self.av_num self.header...
2019-11-09 21:32:26
2646
1
原创 【tensorflow-DenseNet】使用DenseNet训练MNIST
DneseNet的代码:import tensorflow as tfimport tflearnclass DenseNet(object): def __init__(self,growth_rate_K,is_training,dropout_rate): self.growth_rate_K = growth_rate_K self.is_t...
2019-09-23 12:40:27
1719
3
gym[atari,accept-rom-license] Atari2600 游戏组件 Roms.tar.gz
2023-02-21
MPICH2 Windows 64 位版本
2020-06-11
cifar10和100数据集.zip
2020-05-30
【tensorflow-WGAN】生成二次元人物头像
2019-09-28
tensorflow-1.12.0rc0-cp36-cp36m-linux_x86_64.whl
2018-11-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人