自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

得道者

以赤子之心翻越高山,方可奔赴繁花满眼

  • 博客(27)
  • 资源 (2)
  • 收藏
  • 关注

原创 山人求道篇:八、模型的偏差与交易认知

很多多因子策略都会使用机器学习来训练组合因子,对于机器学习训练来说,它往往追求训练的准确性,其实也就是在提高胜率,如果用分类模型而不是回归模型更加容易出现这个问题。规则型策略几乎不会出现一波做反亏完全年的情况。再加上很多中低频的机器学习训练策略CTA是以15,30,60分钟这种级别的数据做回测,在这个时间频率上,反转更有统计意义(这一点可以用一个简单的双均线或动量策略回测即可得出结论)。对行情的描述上,趋势或震荡因子的表达是正确的吗,或者说信息维度足够吗,维度和维度之间是否具有状态变化的关系。

2024-03-05 22:42:00 202

原创 山人求道篇:七、交易的长生之道

《封神》里有一散仙,每次出场皆有斩获,要么就全身而退——陆压道人。

2024-01-03 00:18:59 432

原创 山人求道篇:六、加减仓思路

实际的交易里,面对的都不会是有序和规整行情,能让你一步一个脚印去按着书上说的回调让你加多少,你觉得有这么容易赚钱的办法,还会有那么多人亏钱?

2023-12-25 00:40:54 454

原创 附录:已实现的多品种回测收益

个人的2023年开发心路总结

2023-12-11 11:28:45 514

原创 山人求道篇:五、交易中的大道至简与奥卡姆剃刀

市面上有的策略对各品种设置了不同参数,每个品种进场不一样就算了,出场参数还不一样,那你说他到底赚的是什么利润呢?

2023-12-11 11:17:16 438

原创 山人求道篇:四、大师的经验与理念

网上的突破策略,如果没有对应的仓位管理,是很难在实盘里直接使用的,大部分情况下,都是赚一个月回撤三个月,能把人给熬死

2023-12-11 11:13:31 428

原创 山人求道篇:三、交易中的制胜法宝

量化的对敌心法

2023-12-10 23:34:35 436

原创 山人求道篇:二、交易中的招式与心法

量化交易从招式到心法

2023-12-10 23:28:16 1046

原创 山人求道篇:一、交易系统与现代战争

量化系统跟现代战争的一些相似性

2023-11-30 02:48:36 896

原创 WonderTrader的wtpy简洁搭建流程

简单概括wondertrader,【市面上唯一的能拿到底层C++源码的,且经过资金检验的高频交易系统】,这个价值,懂的都懂。(一般这样水平的都是20个一年的服务费市面上开源的不开源的商业交易系统(框架),80%我都用过或者测试过,不去贬低别的框架,用过才知道。wondertrader的github 地址 https://github.com/wondertrader/wondertrader(c++wtpy的github 地址 https://github.com/wondertrader/wtpy

2022-04-21 15:26:16 6383 1

原创 多维数组计算加速pool

先说计算需求,我的需求是百万级以上的2维矩阵的滑动窗口计算,pandas的rolling是用不了的,只能计算单列,我的矩阵内部同时多列互相计算,包括groupby之类的开始找工具https://zhuanlan.zhihu.com/p/91100281。介绍了as_strided,from numpy.lib.stride_tricks import as_strided as stride在numpy 1.2版本之后还有sliding_window_viewfrom numpy.lib.str

2021-08-05 20:39:56 531

原创 vnpy数字币接入mongodb保存高频行情数据

搞了两天的成果服务器在记录行情tick(先声明要科学上网)1、vnpy 按照官网直接下载安装,需要注意的是,环境里不能有别的版本的python,否则会出问题,最好找一台干净的服务器。(我一开始装在本地电脑,把我原始环境搞乱了,cmd命令都不能正常执行)2、然后是mongodb,我发现这个不需要像以前那样(菜鸟教程里),手工在cmd里配置,只要在vnpy的trade界面里配置就好了。但是要注意,不能配置错误,trade下的setting先不要动,否则会出现pymongodb读取数据库信息出错,导致

2021-05-13 17:56:51 1126

原创 dataframe每一行是dict或者list的嵌套,展开的方式

掘金成分股的原始数据格式 constituents trade_date{'SHSE.600527': 0.009999999776482582, 'SHSE.600461': 0.019999999552965164,···} 2017-07-31 00:00:00{'SHSE.603966': 0.009999999776482582, 'SHSE.603960': 0.009999

2020-12-15 14:34:51 1808

原创 通达信公式改写成python代码

funcat这个包有一部分功能,但大部分通达信函数是不支持的,甚至有一些通达信用多维向量计算的方式,funcat只做成一维数据的循环我自己对此有需求,所以实现了一部分代码def REF(tp1, n): i = 0 ZB_l = [] y = 0 while i < n: y=list(tp1)[i] ZB_l.append(y) i=i+1 while i < len(tp1):

2020-06-16 17:42:07 5908 9

原创 shap解释模型特征,多张图保存的实现(要改源码

原始的shap一般是直接show出特征,需求是保存多张图,做特征变化的对比直接改shap.summary_plot源码可以实现函数参数增加save=False,path=False在summary_plot函数最下面增加 if save: pl.savefig(path) pl.close() 这里必须要close掉图层,要不然会出现多层叠加的问题直接使用代码 explainer = shap.TreeExplainer(mode

2020-06-16 17:31:48 14805 20

原创 python各种空变量问题

这几天在接外部数据源,实时行情,数据接口经常会返回time out或者空数据的问题比如NULL 你用type()去判断是不行的,直接会报错 什么’Nonetype’没有type三种常用判断空变量的方法:1、pd.DataFrame(temp_day_bar).empty==True2、if (str(ref_N)=='nan') or (str(ref_N)=='None'):3、np.isnan针对不同情况使用...

2020-05-14 17:40:39 880

原创 读取很大的压缩文件内任意文件夹下csv的方法

一般格式是rar、zip、7zrar:先要装rarfile,这个东西会爆没有装unrar的问题,然后你会发现pip install unrar 并没有什么鬼用???实际上需要一个UnRAR.exe感谢一下 https://blog.youkuaiyun.com/qq_22186119/article/details/78109819rar_path = rarfile.RarFile("H:/Bai...

2018-12-03 16:08:45 693

原创 形象描述RNN的输入[batch_size, time_step, input_size]

以下参考了https://www.zhihu.com/question/41949741?sort=created LSTM神经网络输入输出究竟是怎样的?问题下 Scofield和刘大力的回答RNN的长这个样子每个纸片是一个时刻的sentence,一个batch里也有t-1时刻纸片的输出作为t时刻纸片的输入,纸片间是有顺序的...

2018-10-30 18:06:08 7326 5

转载 讲清楚embedding到底在干什么

要搞清楚embeding先要弄明白他和one hot encoding的区别,以及他解决了什么one hot encoding不能解决的问题,带着这两个问题去思考,在看一个简单的计算例子以下引用 YJango的Word Embedding–介绍https://zhuanlan.zhihu.com/p/27830489One hot representation程序中编码单词的一个方法是o...

2018-10-28 15:25:49 45774 11

原创 np.select()、np.piecewise()对多条件逻辑判断的向量化计算的支持

当python程序里出现大量的条件判断时,要如何做到让程序运行的速度最快? 这是一直以来都遇到的问题,python的for if else结构速度很慢,特别是[for 里 if 嵌套if] 、[for if 并列 elif]的方法, 暂时写的算法里用的是: 1、np.where()、df.where、df.map替代一部分条件逻辑 2、把条件逻辑判断写到def()里,再apply或者是li...

2018-06-17 16:36:04 4448

原创 Windows 下 jupyter notebook自定义配置

doc输入 jupyter notebook –generate-config 查看弹出的jupyter_notebook_config.py的路径1、code save 路径修改 c.NotebookApp.notebook_dir = ‘D:\数据分析\lhk’2、修改默认打开的浏览器 添加 import webbrowser webbrowser.register(‘chrome’

2017-12-15 09:25:44 1115

原创 tensorflow 多元全连接

老师给了一个数据集,然后要做回归,看R^2。给了个做分类的数据然后让你做回归。。。坑 还说是超过0.07的R方才有资格跟他讨论超参数调优数据下载链接: https://pan.baidu.com/s/1slUKBrn 密码: kyn4sklearn上多元回归、随机森林500颗树的效果 R2 score=0.06 因为正在学tensorflow,所以打算用TF实现同样的效果import pandas

2017-12-06 16:49:13 622

原创 window 下 notebook 中的 pyspark安装

背景:小组成员都习惯用python,但是有spark计算的需求,需要一个快速上手的环境https://www.cnblogs.com/zhw-080/archive/2016/08/05/5740580.html 这位朋友已经写得很详细,就是自己手写环境变量够不够细心的问题第一步:安装anaconda 试一下命令行启动,确保ipython从anaconda启动 第二步:安装spark(需要

2017-12-05 18:08:56 1355

原创 tensorflow 一元线性回归

tensorflow回归预测

2017-12-05 16:50:36 566

原创 python股票数据爬虫requests、etree、BeautifulSoup学习

最近在研究股票数据回测(其实想做量化交易),但是能直接提供数据的API都不太稳定(toshare超时,雅虎的要修复才能用,也不太稳定)#雅虎股票数据API的修复包 from pandas_datareader import data as pdr import fix_yahoo_finance 最后还是打算自己学习下python的爬虫,很早就听说过py爬虫的大名,尝试了下 我觉得OK。impo

2017-09-20 00:14:39 2910

转载 python keras LSTM 学习

python LSTM 学习本文源自https://machinelearningmastery.com/time-series-forecasting-long-short-term-memory-network-python/ 参考http://blog.youkuaiyun.com/Goldxwang/article/details/76207831?locationNum=6&fps=1(非转载,如果

2017-09-19 13:59:56 6114

转载 facebook的python时间序列工具fbprophet

facebook的时间序列工具fbprophet参考自http://blog.youkuaiyun.com/wjskeepmaking/article/details/64905745import pandas as pd import numpy as np from fbprophet import Prophet from matplotlib import pyplot as plt df

2017-09-19 13:41:27 2514

基于Q-learning算法的日内择时策略初窥.py

基于Q-learning算法的日内择时策略初窥

2021-07-24

highLimit分析.py

QUANTAXIS股票分析

2021-07-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除