生成对抗网络GAN学习

生成对抗网络GAN是一个无监督的由生成模型与判别模型二者互相优化组成的模型。

GAN的代码实现里有几个关键点:

1. 对于生成模型,假设数据为mnist数据,则其输入为一个提前设定长度的一个随机向量向量,如可以设置向量长度为100维。

2. 为了更好的生成数据,进一步有受限GAN模型,具体操作为在每一层中,将具体的要生成的类别与当前层的输入联结起来共同作为输入,

(虽然这样的办法简单粗暴,但确实有用),如对于mnist想要生成数字0,对于输入层,在其输入的100维随机向量后,增加一个100维的向量

(1,0,0,0,0,0,0,0,0,0,0),构成110维度的向量作为生成模型的输入。

3.由于生成模型需要根据一个向量生成一个图片,因此它的模型与判别模型过程相反,层次顺序可以为:

全连接层  --》  全连接层  --》  反卷积层  --》sigmod层   --》》生成图像

这里前面两个全连接层主要是为了增加数据的维度,如一开始输入为1×10,下一步为1×1024,再下一步为1×128*7*7,

然后将其reshape后变成一个四维tensor,这样就能参与到反卷积中了,反卷积后生成大小为1*1*28*28的一幅图像。

具体GAN实现的一个系列博客:http://www.cnblogs.com/Charles-Wan/p/6266279.html

博客中的代码,在计算loss时,用到了tf中ones函数与zeros函数,这两个函数的使用相当于去除掉了交叉熵中的各一半,以便

吻合GAN中的损失函数。具体的公式及说明见博客:

http://www.cnblogs.com/Charles-Wan/p/6501945.html

判别模型的目的是最大log(x) + log(1-x'),其中x是真是图片的sigmod输出,x'是假图片的sigmod输出。

(这样,就能使得x越接近1,x'越接近0)

生成模型的目的是最小化log(1-x'),这样,就能使得1-x'越接近0,即x'越接近1。

————————————————————————————————————————————————————————

反卷积最早提出来的论文:Deconvolutional Networks

http://www.matthewzeiler.com/wp-content/uploads/2017/07/cvpr2010.pdf

关于反卷积的一个博客:http://blog.youkuaiyun.com/mao_xiao_feng/article/details/71713358

在Tensorflow中实际操作反卷积时,其实是类似转置的方式,即其操作翻卷机与正向卷积的操作一样,都是正向矩阵相乘的过程。

这样的变换不影响结果。

————————————————————————————————————————————————————————

与Tensorflow相关的一些问题:

Tensorflow中在graph中,每个节点可以为一个variable,而设计到函数重用时,如函数A中生成某个名字的权重矩阵(变量),然后同时有

B与C函数调用A,那么就需要实现变量共享。

变量共享是通过get_variable()函数与variable_scope()来实现的。后者相当于在A函数变量的基础上增加了一个命名空间,用以区别B与C

生成的相同名字的变量。

tensorflow中的函数在操作变量时,是将这个变量放在了graph中,在函数结束时,将保留这个放置好的状态。

如果还有个函数D以此操作B函数两次,例如生成两个相同的卷积层,那么最简单的方式就是在第二次调用B之前执行一次这个函数:

get_variable_scope().reuse_variables()

这个轻量级的函数可以自动将上下两次的A函数生成的变量区分开来。

但还有个问题,设计到optimizer时,对于调用过reuse_variables()的函数来说,一定要将其恢复到非reuse的状态,否则optimizer找不到

这个variable,而恢复reuse是在函数结束或者在一个scope中才可以。因此,对于连续操作两次B,需要将这两次操作放在一个scope中。

如下代码:

with tf.variable_scope(tf.get_variable_scope()):

       D,D_logits = discriminator(images,y)

       #调用一次reuse以便下面继续使用B函数,即discriminator

       tf.get_variable_scope().reuse_variables()

       D_,D_logits_ = discriminator(G,y)

       samples = sampler(z,y)

很多人遇到这个问题,这个问题的官方tensorflow的解释:

https://github.com/tensorflow/tensorflow/issues/6220

但奇怪的时,随机梯度下降算法的optimizer不会报错,别的optimizer比如Adam,Adalet等都会出现这个错误,因此,在连续两次这样的

操作上加上一个scope为暂时的解决方案。

——————————————————————————————————————————————————————

其实GAN本身有很多的问题,由于需要最小化两个目标,而这两个目标又是对立的,即又需要最小化A+B,又需要最大化A。

直观上一看就知道loss的大小不能表示训练的好坏,即训练过程没法通过loss大小看出来。

另外一个问题就是训练过程中容易出问题,即某一个梯度训练不了了。

举个非常直白的例子:A,B两个人各自拿着一块海绵,两人面对面互相推,二者的最终目的是,海绵压倒不能再压,两人的力量达到平衡。

GAN训练的过程可以认为首先B固定不动,A使劲,这样A的海绵压一点儿,然后A固定不动,B使劲,B的海绵压一点儿,这样

到最后总能达到一个平衡。

但是:如果在B固定的过程中,A压的时候用力的方向并不是直接面向B的,而是偏向了一边,两个人错开了。

这样就倒置两个人之间的互相作用崩溃,两个人再按照上面的方式用力,那只能两个人互相维持自己的海绵的状态了。

当然这只是一个能帮助理解的例子,这里有一个讲的非常好的博客:

https://zhuanlan.zhihu.com/p/25071913

WGAN对GAN进行的分析与给出的解决方案的论文:Wasserstein GAN

这篇文章作者的思路与数学功底真强。

———————————————————————————————————————————————————————

【论文复现】一种基于价格弹性矩阵的居民峰谷分时电价激励策略【需求响应】(Matlab代码实现)内容概要:本文介绍了一种基于价格弹性矩阵的居民峰谷分时电价激励策略,旨在通过需求响应机制优化电力系统的负荷分布。该研究利用Matlab进行代码实现,构建了居民用电行为电价变动之间的价格弹性模型,通过分析不同时间段电价调整对用户用电习惯的影响,设计合理的峰谷电价方案,引导用户错峰用电,从而实现电网负荷的削峰填谷,提升电力系统运行效率稳定性。文中详细阐述了价格弹性矩阵的构建方法、优化目标函数的设计以及求解算法的实现过程,并通过仿真验证了所提策略的有效性。; 适合人群:具备一定电力系统基础知识和Matlab编程能力,从事需求响应、电价机制研究或智能电网优化等相关领域的科研人员及研究生。; 使用场景及目标:①研究居民用电行为对电价变化的响应特性;②设计并仿真基于价格弹性矩阵的峰谷分时电价激励策略;③实现需求响应下的电力负荷优化调度;④为电力公司制定科学合理的电价政策提供理论支持和技术工具。; 阅读建议:建议读者结合提供的Matlab代码进行实践操作,深入理解价格弹性建模优化求解过程,同时可参考文中方法拓展至其他需求响应场景,如工业用户、商业楼宇等,进一步提升研究的广度深度。
针对TC275微控制器平台,基于AUTOSAR标准的引导加载程序实现方案 本方案详细阐述了一种专为英飞凌TC275系列微控制器设计的引导加载系统。该系统严格遵循汽车开放系统架构(AUTOSAR)规范进行开发,旨在实现可靠的应用程序刷写启动管理功能。 核心设计严格遵循AUTOSAR分层软件架构。基础软件模块(BSW)的配置管理完全符合标准要求,确保了不同AUTOSAR兼容工具链及软件组件的无缝集成。引导加载程序本身作为独立的软件实体,实现了上层应用软件的完全解耦,其功能涵盖启动阶段的硬件初始化、完整性校验、程序跳转逻辑以及通过指定通信接口(如CAN或以太网)接收和验证新软件数据包。 在具体实现层面,工程代码重点处理了TC275芯片特有的多核架构内存映射机制。代码包含了对所有必要外设驱动(如Flash存储器驱动、通信控制器驱动)的初始化抽象层封装,并设计了严谨的故障安全机制回滚策略,以确保在软件更新过程中出现意外中断时,系统能够恢复到已知的稳定状态。整个引导流程的设计充分考虑了时序确定性、资源占用优化以及功能安全相关需求,为汽车电子控制单元的固件维护升级提供了符合行业标准的底层支持。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值