
python
昵称已被吞噬~‘(*@﹏@*)’~
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【强化学习环境】TSP问题强化学习环境搭建
【代码】【强化学习环境】TSP问题强化学习环境搭建。原创 2023-07-03 16:56:56 · 402 阅读 · 0 评论 -
【强化学习】解决gym安装Atari2600环境gym[atari,accept-rom-license] RuntimeError 无法下载Roms的问题
安装gym[accept-rom-license]时会出现安装失败的情况,因为Roms.tar.gz文件因网络问题下载不下来,而且这个包不是很好找(google上也没找到,还是在一段代码里看见的下载地址),使用一下方法替代:step1:先安装AutoROM: pip install AutoROMstep2:然后使用下载的Roms.tar.gz文件安装Atari2600: AutoROM --source-file ./Roms.tar.gz原创 2023-02-21 11:07:18 · 4102 阅读 · 0 评论 -
【强化学习】tensorflow2.x PPO-Clip with GAE 训练 agent 玩 Atari
【强化学习】tensorflow2.x PPO-clip with GAE 训练 agent 玩 Atari原创 2023-02-20 10:25:18 · 340 阅读 · 0 评论 -
【强化学习】基于tensorflow2.x 的 PPO2(离散动作情况) 训练 CartPole-v1
【强化学习】基于tensorflow2.x 的 PPO2(离散动作情况) 训练 CartPole-v1。原创 2023-01-18 01:24:21 · 1295 阅读 · 0 评论 -
【深度强化学习实战】tensorflow2.x 训练 muzero 玩井字棋(tic-tac-toe)
【深度强化学习实战】tensorflow2.x 训练 muzero 玩井字棋(tic-tac-toe)原创 2022-08-04 09:14:25 · 733 阅读 · 0 评论 -
【tensorflow2.x】使用 wgan-gp 生成 mnist 手写数字
tensorflow2.x实现wgan生成mnist手写数字原创 2022-07-30 11:12:25 · 536 阅读 · 0 评论 -
【tensorflow2.x】自编码器mnist
【tensorflow2.x】自编码器mnist。原创 2022-07-23 14:03:28 · 229 阅读 · 0 评论 -
【强化学习】tensorflow2.x 构造 SoftActorCritic(SAC) 训练 LunarLanderContinuous-v2
论文地址.策略网络的损失函数不是按照原论文所写。requirements.txt:tensorflow-gpu==2.4.0gym[all]==0.21.0tensorflow_probability==0.14.0keras==2.6.0matplotlib==3.5.1from tensorflow.keras import layers, models, Input, optimizers, lossesfrom tensorflow_probability.python...原创 2022-04-14 23:47:24 · 2209 阅读 · 9 评论 -
【强化学习】强化学习环境搭建,gym构造五子棋Gomoku
from gym.envs.classic_control import renderingimport numpy as npimport gymdef check(filter, state, size, filter_w, filter_h): done = False result = [] for i in range(size - filter_h + 1): for j in range(size - filter_w + 1):原创 2022-02-26 22:41:28 · 1324 阅读 · 0 评论 -
【强化学习】MuZero 训练CartPole-v1
【深度强化学习】tensorflow2.0复现Google DeepMind版本的muzero训练CartPole-v1参考资料:[1]ColinFred. 蒙特卡洛树搜索(MCTS)代码详解【python】. 2019-03-23 23:37:09.[2]饼干Japson 深度强化学习实验室.【论文深度研读报告】MuZero算法过程详解.2021-01-19.[3]Tangarf. Muzero算法研读报告. 2020-08-31 11:40:20 .[4]带带弟弟好吗. AlphaGo版本三原创 2022-02-25 19:02:41 · 7137 阅读 · 17 评论 -
【强化学习】tensorflow2.0构造DDPG训练LunarLanderContinuous-v2
from tensorflow.keras import optimizers, layers, models, lossesfrom collections import dequeimport matplotlib.pyplot as pltimport tensorflow as tfimport numpy as npimport randomimport gymimport copy# 配置GPU内存physical_devices = tf.config.experiment原创 2022-02-08 11:49:33 · 2648 阅读 · 0 评论 -
【python】B站电影爬虫
有时我们苦于在线观看网络太慢有时我们苦于大会员即将到期却没有时间看想看的电影有时我们苦于付费电影只有三天的观看期限有时我们苦于有想多次细细品尝的电影但B站却无法下载… … -。- … …为能更好地使用我们大会员的权利,这里提供一种下载B站电影的爬虫方法一. 抓包这里直接使用浏览器的开发者工具,选择 Network,在里面找属于音频和视频的数据包(B站的音频和视频传过来的时候是分开的)一般为这几个,视频一般为 “-1-30112”,音频为 “-1-30280”,不过这个也可以根据点开后看数原创 2021-07-30 21:57:16 · 5155 阅读 · 1 评论 -
【强化学习】基于tensorflow2.2实现A3C训练火箭着陆器LunarLander-v2
本来是想训练SpaceInvaders-v4来着,结果电脑train不起来,就换成LunarLander-v2了import matplotlib.pyplot as pltimport tensorflow as tfimport numpy as npimport threadingimport gymepisodes = 2000gamma = 0.9learning_rate = 1e-3num_workers = 3game = 'LunarLander-v2'state原创 2021-05-24 23:41:58 · 1069 阅读 · 0 评论 -
【colab】白嫖Google的tpu和gpu
先打开Google云盘.在关联应用里搜索 Colaboratory 安装插件。安装完成后就可以直接在Google云盘里创建colab了。然后在 ‘代码执行程序’ 里找 ‘更改运行时类型’, 可以选择实在gpu上跑还是tpu。(这里的gpu是Tesla T4,因为 gpu 的话网上资料一大把,这里接下来已 tpu 为例)可以通过一下代码将你的 Google云盘挂载到 notebook上(这里会给你一个网址,打开后是Google云盘的授权码,粘贴下来,因为这里已经授权过了所以下图中没有提示,原创 2021-04-14 18:35:27 · 2891 阅读 · 5 评论 -
【强化学习实战】tensorflow2.0 实现 MuZero
参考:[1]ColinFred. 蒙特卡洛树搜索(MCTS)代码详解【python】. 2019-03-23 23:37:09.[2]饼干Japson 深度强化学习实验室.【论文深度研读报告】MuZero算法过程详解.2021-01-19.[3]Tangarf. Muzero算法研读报告. 2020-08-31 11:40:20 .[4]带带弟弟好吗. AlphaGo版本三——MuZero. 2020-08-30.[5]Google原论文:Mastering Atari, Go, Chess a原创 2021-02-08 11:59:59 · 1018 阅读 · 2 评论 -
【cython学习】分别使用python和cython运行斐波那契数列并计算时间
本文使用递归斐波那契数列的算法,可以直观得看出使用cython后明显的速度提升具体代码如下fib.c#include<stdio.h>#include "fib.h"long int fib(int n){ if(n == 0 || n == 1){ return 1; } else{ return (fib(n - 1) + fib(n - 2)); }}fib.hlong int fib(int n.原创 2020-07-24 17:10:15 · 480 阅读 · 0 评论 -
【python】numpy实现线性回归
import numpy as npimport matplotlib.pyplot as pltclass linear: def __init__(self, fileName, splitBy=',', lr=1e-4, epochs=50): self.lr = lr self.epochs = epochs # 定义学习率和训练轮数...原创 2019-12-09 12:30:37 · 470 阅读 · 0 评论 -
【python】numpy实现PCA降维
import numpy as npclass PCA: def __init__(self, fileName, splitBy=' '): self.readData = np.array([line.split(splitBy) for line in open(fileName).readlines()], dtype='float') # 读取数据为num...原创 2019-12-08 20:36:17 · 1011 阅读 · 0 评论 -
【python】numpy实现逻辑回归
import numpy as npclass logistic: def __init__(self, fileName, splitBy='\t'): self.lr = 1e-3 self.epochs = 3000 # 定义学习率和训练轮数 data = np.array([line.split(splitBy) for li...原创 2019-12-08 20:12:56 · 578 阅读 · 0 评论