- 博客(27)
- 资源 (2)
- 收藏
- 关注
原创 山人求道篇:八、模型的偏差与交易认知
很多多因子策略都会使用机器学习来训练组合因子,对于机器学习训练来说,它往往追求训练的准确性,其实也就是在提高胜率,如果用分类模型而不是回归模型更加容易出现这个问题。规则型策略几乎不会出现一波做反亏完全年的情况。再加上很多中低频的机器学习训练策略CTA是以15,30,60分钟这种级别的数据做回测,在这个时间频率上,反转更有统计意义(这一点可以用一个简单的双均线或动量策略回测即可得出结论)。对行情的描述上,趋势或震荡因子的表达是正确的吗,或者说信息维度足够吗,维度和维度之间是否具有状态变化的关系。
2024-03-05 22:42:00
202
原创 山人求道篇:六、加减仓思路
实际的交易里,面对的都不会是有序和规整行情,能让你一步一个脚印去按着书上说的回调让你加多少,你觉得有这么容易赚钱的办法,还会有那么多人亏钱?
2023-12-25 00:40:54
454
原创 山人求道篇:五、交易中的大道至简与奥卡姆剃刀
市面上有的策略对各品种设置了不同参数,每个品种进场不一样就算了,出场参数还不一样,那你说他到底赚的是什么利润呢?
2023-12-11 11:17:16
438
原创 山人求道篇:四、大师的经验与理念
网上的突破策略,如果没有对应的仓位管理,是很难在实盘里直接使用的,大部分情况下,都是赚一个月回撤三个月,能把人给熬死
2023-12-11 11:13:31
428
原创 WonderTrader的wtpy简洁搭建流程
简单概括wondertrader,【市面上唯一的能拿到底层C++源码的,且经过资金检验的高频交易系统】,这个价值,懂的都懂。(一般这样水平的都是20个一年的服务费市面上开源的不开源的商业交易系统(框架),80%我都用过或者测试过,不去贬低别的框架,用过才知道。wondertrader的github 地址 https://github.com/wondertrader/wondertrader(c++wtpy的github 地址 https://github.com/wondertrader/wtpy
2022-04-21 15:26:16
6383
1
原创 多维数组计算加速pool
先说计算需求,我的需求是百万级以上的2维矩阵的滑动窗口计算,pandas的rolling是用不了的,只能计算单列,我的矩阵内部同时多列互相计算,包括groupby之类的开始找工具https://zhuanlan.zhihu.com/p/91100281。介绍了as_strided,from numpy.lib.stride_tricks import as_strided as stride在numpy 1.2版本之后还有sliding_window_viewfrom numpy.lib.str
2021-08-05 20:39:56
531
原创 vnpy数字币接入mongodb保存高频行情数据
搞了两天的成果服务器在记录行情tick(先声明要科学上网)1、vnpy 按照官网直接下载安装,需要注意的是,环境里不能有别的版本的python,否则会出问题,最好找一台干净的服务器。(我一开始装在本地电脑,把我原始环境搞乱了,cmd命令都不能正常执行)2、然后是mongodb,我发现这个不需要像以前那样(菜鸟教程里),手工在cmd里配置,只要在vnpy的trade界面里配置就好了。但是要注意,不能配置错误,trade下的setting先不要动,否则会出现pymongodb读取数据库信息出错,导致
2021-05-13 17:56:51
1126
原创 dataframe每一行是dict或者list的嵌套,展开的方式
掘金成分股的原始数据格式 constituents trade_date{'SHSE.600527': 0.009999999776482582, 'SHSE.600461': 0.019999999552965164,···} 2017-07-31 00:00:00{'SHSE.603966': 0.009999999776482582, 'SHSE.603960': 0.009999
2020-12-15 14:34:51
1808
原创 通达信公式改写成python代码
funcat这个包有一部分功能,但大部分通达信函数是不支持的,甚至有一些通达信用多维向量计算的方式,funcat只做成一维数据的循环我自己对此有需求,所以实现了一部分代码def REF(tp1, n): i = 0 ZB_l = [] y = 0 while i < n: y=list(tp1)[i] ZB_l.append(y) i=i+1 while i < len(tp1):
2020-06-16 17:42:07
5908
9
原创 shap解释模型特征,多张图保存的实现(要改源码
原始的shap一般是直接show出特征,需求是保存多张图,做特征变化的对比直接改shap.summary_plot源码可以实现函数参数增加save=False,path=False在summary_plot函数最下面增加 if save: pl.savefig(path) pl.close() 这里必须要close掉图层,要不然会出现多层叠加的问题直接使用代码 explainer = shap.TreeExplainer(mode
2020-06-16 17:31:48
14805
20
原创 python各种空变量问题
这几天在接外部数据源,实时行情,数据接口经常会返回time out或者空数据的问题比如NULL 你用type()去判断是不行的,直接会报错 什么’Nonetype’没有type三种常用判断空变量的方法:1、pd.DataFrame(temp_day_bar).empty==True2、if (str(ref_N)=='nan') or (str(ref_N)=='None'):3、np.isnan针对不同情况使用...
2020-05-14 17:40:39
880
原创 读取很大的压缩文件内任意文件夹下csv的方法
一般格式是rar、zip、7zrar:先要装rarfile,这个东西会爆没有装unrar的问题,然后你会发现pip install unrar 并没有什么鬼用???实际上需要一个UnRAR.exe感谢一下 https://blog.youkuaiyun.com/qq_22186119/article/details/78109819rar_path = rarfile.RarFile("H:/Bai...
2018-12-03 16:08:45
693
原创 形象描述RNN的输入[batch_size, time_step, input_size]
以下参考了https://www.zhihu.com/question/41949741?sort=created LSTM神经网络输入输出究竟是怎样的?问题下 Scofield和刘大力的回答RNN的长这个样子每个纸片是一个时刻的sentence,一个batch里也有t-1时刻纸片的输出作为t时刻纸片的输入,纸片间是有顺序的...
2018-10-30 18:06:08
7326
5
转载 讲清楚embedding到底在干什么
要搞清楚embeding先要弄明白他和one hot encoding的区别,以及他解决了什么one hot encoding不能解决的问题,带着这两个问题去思考,在看一个简单的计算例子以下引用 YJango的Word Embedding–介绍https://zhuanlan.zhihu.com/p/27830489One hot representation程序中编码单词的一个方法是o...
2018-10-28 15:25:49
45774
11
原创 np.select()、np.piecewise()对多条件逻辑判断的向量化计算的支持
当python程序里出现大量的条件判断时,要如何做到让程序运行的速度最快? 这是一直以来都遇到的问题,python的for if else结构速度很慢,特别是[for 里 if 嵌套if] 、[for if 并列 elif]的方法, 暂时写的算法里用的是: 1、np.where()、df.where、df.map替代一部分条件逻辑 2、把条件逻辑判断写到def()里,再apply或者是li...
2018-06-17 16:36:04
4448
原创 Windows 下 jupyter notebook自定义配置
doc输入 jupyter notebook –generate-config 查看弹出的jupyter_notebook_config.py的路径1、code save 路径修改 c.NotebookApp.notebook_dir = ‘D:\数据分析\lhk’2、修改默认打开的浏览器 添加 import webbrowser webbrowser.register(‘chrome’
2017-12-15 09:25:44
1115
原创 tensorflow 多元全连接
老师给了一个数据集,然后要做回归,看R^2。给了个做分类的数据然后让你做回归。。。坑 还说是超过0.07的R方才有资格跟他讨论超参数调优数据下载链接: https://pan.baidu.com/s/1slUKBrn 密码: kyn4sklearn上多元回归、随机森林500颗树的效果 R2 score=0.06 因为正在学tensorflow,所以打算用TF实现同样的效果import pandas
2017-12-06 16:49:13
622
原创 window 下 notebook 中的 pyspark安装
背景:小组成员都习惯用python,但是有spark计算的需求,需要一个快速上手的环境https://www.cnblogs.com/zhw-080/archive/2016/08/05/5740580.html 这位朋友已经写得很详细,就是自己手写环境变量够不够细心的问题第一步:安装anaconda 试一下命令行启动,确保ipython从anaconda启动 第二步:安装spark(需要
2017-12-05 18:08:56
1355
原创 python股票数据爬虫requests、etree、BeautifulSoup学习
最近在研究股票数据回测(其实想做量化交易),但是能直接提供数据的API都不太稳定(toshare超时,雅虎的要修复才能用,也不太稳定)#雅虎股票数据API的修复包 from pandas_datareader import data as pdr import fix_yahoo_finance 最后还是打算自己学习下python的爬虫,很早就听说过py爬虫的大名,尝试了下 我觉得OK。impo
2017-09-20 00:14:39
2910
转载 python keras LSTM 学习
python LSTM 学习本文源自https://machinelearningmastery.com/time-series-forecasting-long-short-term-memory-network-python/ 参考http://blog.youkuaiyun.com/Goldxwang/article/details/76207831?locationNum=6&fps=1(非转载,如果
2017-09-19 13:59:56
6114
转载 facebook的python时间序列工具fbprophet
facebook的时间序列工具fbprophet参考自http://blog.youkuaiyun.com/wjskeepmaking/article/details/64905745import pandas as pd import numpy as np from fbprophet import Prophet from matplotlib import pyplot as plt df
2017-09-19 13:41:27
2514
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人