- 博客(14)
- 收藏
- 关注
原创 【mathematic软件画函数图】
(1)Plot画平面曲线y=1-2x和y=4x-2。(2)Graphics函数绘制平面区域。(3)绘制三维曲面图。
2024-04-30 11:56:40
873
原创 python对windows指定窗口截图
1.安装WinSpy。2.用WinSpy找到制定窗口的句柄。例如:用WinSpy识别QQ窗口的句柄。3.在python中用win32gui包获取所指句柄的窗口。具体代码如下:from PyQt5.QtWidgets import QApplication,QMainWindowfrom PyQt5.QtGui import *import win32guiimport sys import cv2 # 利用opencv读取图像import numpy as np# 利用matplo
2022-04-15 10:37:05
6296
2
原创 【Python 深度强化学习算法(A3C)预测未来股票走势】
本项目利用深度强化学习中的A3C算法提取某支股票的历史数据特征,然后预测未来15天的收盘价格走势。注:1)本项目使用tensorflow1.14版本。2)投资有风险,理财需谨慎。3)本人选择某股训练结果如下,通过实践表明,在市场环境相对稳定的情况下,本代码能够正确预测未来几天内的升降情况。但是单价数据会有些出入。1.数据导入需要从财经类网站自行下载自己意向的股票历史数据,将数据导入py文件中的python代码路径指向保存好的股票历史路径。通过训练1000次学习后预算未来15天的收盘价走势。"
2022-02-22 17:49:38
3305
15
原创 Actor-critic强化学习算法
##Actor-critic算法import randomimport matplotlib.pyplot as pltx=[]y=[]def random_pick(some_list, probabilities):random_num = random.uniform(0,1)cumulative_probability = 0.0for item, item_probability in zip(some_list, probabilities): #遍历cumulativ
2021-11-24 16:17:47
1138
原创 Generalized Infinitesimal Gradient Ascent(GIGA)
Generalized Infinitesimal Gradient Ascent(GIGA)
2021-10-26 16:12:05
289
原创 神经网络——激活函数
神经网络——激活函数1959年,生物科学家研究青蛙神经元的时候发现,青蛙的神经元有多个输入(树突),当各个输入信号达到一定的阈值时,信号才会得到相应(激活)。于是计算机科学家由这得到启发创建神经网络的激活函数。最开始的激活函数时阶梯函数:当信号达到一定的值时,值才为1,否则为0.但是阶梯函数的缺点是的导数为0,无法进行参数跟新时,就有sigmoid函数,tanh函数,relu函数等等**sigmoid函数:**优点:处处可导,但是当自变量很大时,倒数趋于0,这时候用梯度更新参数时基本不会有多大改
2021-06-10 22:29:06
312
3
原创 基于DP的MDP中的值迭代和策略迭代的区别
值迭代和策略迭代的区别 值迭代与策略迭代都是强化学习中的动态规划方法(DP), 它们的框架相同,都包含两个过程——策略估计和策略改进。 不同的是策略迭代是在策略评估之后,等到值函数收敛之后再进行策略改进,而值迭代是在策略评估的时候,只要值函数改变,就直接进行策略改进。我们用伪代码比较两者的区别。策略迭代:值迭代:...
2021-03-07 21:18:34
1595
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人