
随笔
文章平均质量分 88
PilviMannis
这个作者很懒,什么都没留下…
展开
-
IMPALA(Importance Weighted Actor-Learner Architectures)
IMPALA(Importance Weighted Actor-Learner Architectures)策略梯度方法已成功地应用于许多复杂的强化学习问题。然而,政策梯度法存在方差大、收敛速度慢、探索效率低等问题。在这项工作中,我们引入了一个最大熵策略优化框架,它明确地鼓励参数探索,并表明这个框架可以简化为一个贝叶斯推理问题。在此基础上,我们提出了一种新的Stein变分策略梯度方法(SVPG),该方法结合了现有的策略梯度方法和一个排斥函数来生成一组多样化但表现良好的策略。SVPG对于初始化是健壮的,原创 2021-02-24 15:55:48 · 714 阅读 · 1 评论 -
离散数据作为神经网络的输入,我们该如何进行处理
离散数据归一化处理离散型数据处理方式one-hot(原因总结如下):使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间中的某个点;将离散的特征通过one-hot编码映射到欧式空间,是因为在回归、聚类、分类等机器学习算法中,特征之间距离的计算或者相似度的计算是非常重要的,而我们常用的距离或者相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。将离散型特征使用one-hot编码,确实会让特征之间的距离计算更加合理。比如,有一个离散型特征,原创 2020-12-21 11:06:16 · 5069 阅读 · 3 评论 -
深度学习在数据中的应用---循环神经网络
第一次接触循环神经网络。。。。。。循环神经网络是针对序列数据建模的深度学习模型,在自然语言处理、语音识别等领域中应用较为广泛。(以前接触的基本上都是图像方面的东西) 先总结一下文章的内容,下次主要介绍一下循环神经网络的工作机理: 看完文章得到的结果就是:CNN比较适用于图像特征的挖掘,RNN比较适用于序列数据的处理。由于深度学习模型需要大数据的支撑,可训练的数据较少时可以通...原创 2018-08-22 14:55:35 · 716 阅读 · 0 评论 -
Python gRPC 环境搭建及测试
参考文章:https://www.jianshu.com/p/14e6f5217f40(修改了部分bug--两个main函数,作者的写法只适用于所有文件夹在同一目录的情况,若是两个不同的文件夹,运行会出错。)小白一枚,啥也不懂,直接上手,虽然不知道我在干什么,但是我运行成功了,手动哈哈哈。。。安装:gRPC 的安装:$ pip install grpcio安装 ProtoBu...原创 2018-09-21 17:01:01 · 6655 阅读 · 7 评论 -
Ubuntu wifinetwork无法设置的问题
直接运行:sudo /etc/init.d/NetworkManager/NetworkManager.conf完美解决!原创 2018-09-27 18:43:13 · 810 阅读 · 0 评论 -
tf.contrib.rnn
Class tf.contrib.rnn.BasicLSTMCell Class tf.nn.rnn_cell.BasicLSTMCell 其实两个是等价的,只是版本的问题,表示定义一个LSTM结构,所使用的变量会自动进行声明。Args:num_units: int, The number of units in the LSTM cell.神经元数量 forget_bias: flo...原创 2019-01-20 11:22:45 · 705 阅读 · 0 评论 -
MacOS搭建openai环境
首先是安装Homebrew:https://brew.sh/index_zh-cn输入指令:/usr/bin/ruby -e “$(curl -fsSLhttps://raw.githubusercontent.com/Homebrew/install/master/install)”需要注意的是password输入的是开机密码不是id密码。完成之后输入brew -v来查看是否安装...原创 2019-04-27 09:44:50 · 2808 阅读 · 0 评论 -
python list 取部分值
代码解读:list1 = [1,2,3,4,5,6,7,8,9,0]若是想取前几项,如:前5项 该列表表示的是正向索引(index)0 1 2 3 4 5 6 7 8 9 ...原创 2019-05-30 17:31:03 · 34842 阅读 · 0 评论