- 博客(5)
- 收藏
- 关注
原创 深度强化学习算法(朴素DQN,DDQN,PPO,A3C等)比较与实现
不同算法的理论比较部分参考优快云博客 - 专业IT技术发表平台,代码实现在python完成。用的算例是OpenAI官网gym提供的算例环境"CartPole-v1"游戏,代码实现部分在谷歌全家桶(Colab,tensorflow2,wandb)中完成1.朴素DQN原论文:[DQN] Playing Atari with Deep Reinforcement Learning [1]Off-policy,Discrete action space,model free,2015算法:.
2021-10-07 15:15:52
4122
原创 Kaggle的一个入门级比赛Tatanic数据集二分类(python实现)
这是一个kaggle入门级比赛。程序基于pytorch,目的是利用数据集train_data训练一个神经网络,用以预测test_data的结果。上传kaggle后最终得分0.76(我很菜)。数据链接如下 https://www.kaggle.com/c/titanic/data代码如下:import torchfrom torch.utils.data import Datasetimport num...
2021-07-07 00:28:58
783
原创 简单练习——python实现卷积神经网络(CNN)识别猫狗,以及我对CNN理解的通俗表达
这是一个用python写CNN的小练习,目标是构建一个能够完成二分类任务(识别猫或者狗)的CNN。这是一部分的结果展示,可以看到被展示的经过预处理后的图片都被准确 用以训练神经网络的数据集由8000张带标签的jpg图片构成,其中猫狗各4000张。任务可以分为五个部分:1.导入训练数据2.数据预处理3.构建神经网络4.训练神经网络5.评价以及预测结果查看...
2021-07-01 22:42:58
4216
3
原创 基于动态规划的微电网黑启动优化算例的python实现(原创干货)
为了发小论文,这俩天写python写了一个微电网黑启动优化算例,由于小论文从投稿到录用还需要几个月,出于保护知识产区的考虑,在这里只分享一个简化后的模型。考虑到很多不是电气专业的朋友,这里给出表示拓扑的简单示意图。 对于拓扑图中每一个开关 Si,其属性用一个三维向量表示[si,Pi,Ci]。si表示开关对应的开关状态,Pi表示该开关对应节点上负载功率,Ci表示人工打开该开关所需成本。 本算例优化的目标函数为这里~表示对位求反,简单说就是0 1互换。考虑电网的频率稳定,约束函数...
2021-06-27 21:13:56
750
原创 几行python代码搞定一个识别手写数字集(Mnist)的机器学习程序
0.引言为了发小论文,最近重新整理了一下深度学习的一些基础知识。我发现哪怕是一些最基础的代码(比如题目中的Mnist数字集的识别),刚学的时候对着教材抄代码以为自己都搞懂了,后面才发现其实简单的代码里还藏着很多初学时候搞不懂的知识点。翻了一下优快云上关于Mnist识别的教程里面,基本都是告诉你是什么该怎么做,但往往没有告诉你为什么要这么做,这可能导致初学者看着教程懂了要怎么干,但是关掉教程却发现什么也没学到。基于此我想写这一个blog帮助一些人工智能特别是深度学习的初学者更好的理解这个相当于‘hell
2021-06-26 01:06:25
1814
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人