AlphaFinance
拥有18余年算法、数据处理、软件开发和AI应用经验。熟悉Hadoop、Pyspark、GCP等大数据技术和云计算,具备全周期软件开发和MLOps实践经验。精通机器学习、深度学习算法,有强化学习研究背景。熟悉图像处理方法,能开发目标检测和人脸识别系统。擅长NLP应用开发,有Rasa、LLaMA等框架使用经验。能独立开发高精度量化交易模型。具备Java大型系统开发经验,熟悉多线程和并发容器。擅长Python、C#等编程语言,熟悉数据库应用。了解微服务、架构设计等领域。具备高质量文档编写能力,熟悉Markdown语法。具有良好的代码品味和问题解决能力,擅长团队合作与沟通。热衷于学习前沿技术。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
量化交易领域输入层多少特征可以满足要求?
在量化交易中,输入层需要的特征数量根据交易策略和数据集不同而异,包括基本面、技术指标、市场和财务数据等。为了提高模型准确性,特征数量应尽可能多,但也需考虑数据集大小和模型计算复杂度。在高频交易中特征较少,而长期交易中特征较多。需综合考虑多个因素并适当权衡。原创 2023-04-12 10:48:58 · 209 阅读 · 0 评论 -
在量化交易领域,交叉验证的方法会使整个框架设计变得很复杂
在量化交易中,数据是时间序列数据,因此,需要确保在模型训练和验证过程中保持时间序列的结构。仅使用训练集和验证集(没有测试集),然后在验证集上进行超参数调整。这种方法的缺点是,您将无法获得对模型在未见过的数据上的泛化能力的独立评估。在量化交易中,关键是找到一个平衡点,以实现较好的泛化性能、避免过拟合,并确保框架易于实现和维护。采用集成学习方法,如bagging或boosting,以提高模型的泛化能力和稳定性。在模型训练和调优过程中,使用正则化技术(如L1和L2正则化)来减轻过拟合的风险。原创 2023-04-10 21:26:52 · 288 阅读 · 0 评论 -
为什么加入rotary_embedding后效果不好?
Rotary Embedding是一种在循环神经网络中使用的技术,通过对输入数据进行旋转来引入周期性信息,以增强模型的表示能力。然而,引入Rotary Embedding不一定总是能够提高模型的性能,可能还需要对数据和模型进行其他的调整。模型架构的不适配:Rotary Embedding是为循环神经网络设计的,如果在其他类型的模型中使用,可能会出现性能下降的情况。Rotary Embedding参数的选择:Rotary Embedding的效果很大程度上取决于它的参数设置,如角度数和旋转轴的选择。原创 2023-04-05 07:04:23 · 1732 阅读 · 0 评论 -
获取指定日期下一个交易日的日期(python实现)
输入格式为:[[‘2022-8-15’,‘1’],[‘2022-8-16’,'1]],其中1代表前面那个日期为交易日,否则为0。原创 2022-08-16 19:28:09 · 1587 阅读 · 0 评论 -
也许用强化学习来研究股票效果会很好
把强化学习和深度学习对比:训练一个机器人走路,我们没法给机器人准备训练用的数据集,因为我也不清楚什么动作比较好,我只能告诉机器人:“无论你做什么动作,能让你越快达到终点的动作越好”。训练时,机器人(智能体 agent)会自行探索各种动作组合(策略 policy)。强化学习算法需要对动作未来的收益(Q值 Q value)进行预测,然后根据预测结果「对高收益的动作进行强化」,并验证那些有高预期收益的动作组合。从而让机器人(智能体 agent)在人类的引导下自学(越好的强化学习算法越不用人类操心)。原创 2022-03-10 09:25:31 · 1929 阅读 · 0 评论 -
利用python计算指定标的的涨幅
计算日线涨幅:方法一知识点:MonthEnd(0),插入每个月的月末日期。不过月末日期常常不够精确,使用每个月最后一个交易日的日期更加靠谱。spy_data = pdr.get_data_yahoo(['SPY'], start="2020-12-01", end="2021-09-30")spy_data = spy_data['Adj Close'].reset_index()spy_data['date'] = pd.to_datetime(spy_data['Date'], format="原创 2022-03-02 13:32:10 · 1405 阅读 · 0 评论 -
How to looking for financial information sources of US stocks
1. ProspectusThe prospectus of US stocks includes the disclosure of business data, the short-term and long-term development of the company, etc. the risk prompt part is usually written by lawyers, which is the most important material for studying the comp原创 2022-02-28 15:43:12 · 239 阅读 · 0 评论 -
A Practitioner’s Guide to Factor Models——阅读笔记
MissionThe mission of the Research Foundation is to identify, fund, and publish research material that:expands the body of relevant and useful knowledge available to practitioners; assists practitioners in understanding and applying this knowledge; and e翻译 2022-02-22 00:00:51 · 216 阅读 · 0 评论 -
Buffett’s Alpha读书笔记
AbstractBerkshire Hathaway has realized a Sharpe ratio of 0.79 with significant alpha to traditional risk factors. However, the alpha becomes insignificant when controlling for exposures to BettingAgainst-Beta and Quality-Minus-Junk factors. Further, we翻译 2022-02-17 18:34:03 · 375 阅读 · 0 评论 -
一个关键指标:trading_loss_div_recent_loss_n
当recent_loss_n从1逐步增加到4+的时候,更稳定的股票可以被优先选择出来。原创 2021-12-18 02:14:50 · 377 阅读 · 0 评论 -
筹码分布的计算方法笔记
http://blog.sina.com.cn/s/blog_b27de4f90102yuk3.html原创 2021-12-14 03:57:10 · 3825 阅读 · 2 评论 -
如何获得财务数据信息
如何用炒股软件导出想要的财务数据??https://www.zhihu.com/question/63534632/answer/210349349介绍了如何利用通达信下载财务数据的方法,然而这种方法需要熟练掌握通达信的函数才能发挥它的作用。如何使用同花顺客户端获取上市公司的财务数据https://jingyan.baidu.com/article/0964eca27b29878285f5362c.html这篇文章介绍了如何利用同花顺的PC版下载财务数据,不足之处是难以批量下载。原创 2021-12-10 11:45:51 · 743 阅读 · 0 评论 -
债券市场也有波动和熊市,债基应该在什么情况下退出?
债券市场属于风险资产,不像货币基金那样只涨不跌,债券基金也有波动和熊市,如果踩不对债市节奏的话,亏好几个点也很有可能。所以,投资债券基金也要学会如何卖出?1,盯着10年期国债收益率的拐点。国债是债券市场里数量最多、规模最大的品种,而且因为国债属于利率债没有信用风险,所以在金融市场,10年期国债的收益率通常被视为无风险利率的代表。当10年期国债收益率(相对9年国债收益率)拐头上行,说明利率开始抬升,这将降低(拥有固定收益率的)债券的吸引力,债市开始转跌进入熊市,这时候应该卖出债基。同理,10年期国债收益率下原创 2021-12-10 08:40:12 · 12813 阅读 · 0 评论 -
基金经理简单梳理
原创 2021-12-09 06:56:39 · 375 阅读 · 0 评论 -
短线选股的一种方法
介绍短线几个关键指标。原创 2021-12-06 07:59:35 · 2218 阅读 · 0 评论 -
成交量规律
缩量上涨还会上涨缩量下跌还会下跌高位放量上涨必然下跌低位放巨量上涨,必会回调低位放巨量下跌,必有反弹放量滞涨,顶部信号缩量不跌,底部已现量大成头,量小成底底部无量下跌,后市还会创新高顶部放量下跌,后市很难创新高...原创 2021-11-29 06:55:50 · 13264 阅读 · 0 评论 -
目前量化交易系统性能(2021-11-10)
原创 2021-11-10 20:43:28 · 376 阅读 · 0 评论 -
利用captum.attr的IntegratedGradients工具进行特征选择实验
去掉“16个交易日内的涨停情况(riseStopInfo)”、“16个交易日内的跌停情况(fallStopInfo)”这两个特征后:特征重要度为0的特征:16个交易日内的一字板跌停情况(fallStop1zbNumIn16days)1个股票得到的特征重要度分布:Average Importance of Featurescode : 0.000000000month_day : -0.000000024tradeDayInMonth : -0.000000008open : .原创 2021-11-05 19:05:49 · 1218 阅读 · 0 评论 -
通过python的yfinance包获取股票数据
安装yfinance包#!env bashpip install numpypip install pandaspip install requestspip install yfinance如果是conda环境,可以使用下面的代码安装:#! env bashconda install -c ranaroussi yfinance然而这样安装还是有可能会失败。如果不是非要用conda,建议还是使用pip。参考资料https://www.bobobk.com/512.html..原创 2021-09-25 11:29:35 · 3326 阅读 · 0 评论 -
股票量化交易系统搭建问题探究
如果想不清楚如何解决如下问题,那么冒然搭建股票量化交易系统是非常危险的。本文根据多年开发心得,将搭建过程中遇到的重难点问题进行了梳理。1、社会中的各种信息是否已经全部反映在了K线中?有不少观点认为K线中已经蕴含了所有信息,也有人认为不认同。对于不认同的观点而言,一个简单的反例是我拿出一大笔钱在某一时刻随机买入某一只股票对其股价造成波动,那么从历史K线就无法预测出我的这个行为,然而这种行为是噪声而不是规律。在很多其它的机器学习问题中也会遇到这种噪声点。所以我认为上面这个反例并不合适。是否有更好的反例?原创 2021-03-31 14:15:29 · 1216 阅读 · 1 评论 -
论文翻译(一):Stock-wise Technical Indicator Optimization with Stock Embedding
需要好好学习别人的技术了。今天找到一篇好文章,标题非常吸引人。完整标题是:Individualized Indicator for All: Stock-wise Technical Indicator Optimization with Stock Embedding。翻译得有点粗糙,只是便于先了解文章大意。摘要作为最重要的投资手段之一,技术分析试图通过解释历史价格和成交量数据的内在规律来预测股票的走势。为了解决金融市场的嘈杂本质,通用技术分析开发了技术交易指标,作为历史价格和成交量数据的数学概括原创 2021-03-18 10:03:39 · 741 阅读 · 0 评论 -
股票量化分析系统浅析之(五)训练集越多越好吗
对于同一组测试集,使用两个不同的seed进行两次实验,这两次实验的训练集都更大,但是一次实验结果是测试集精度上升,另外一次实验结果是测试集精度下降。两组实验虽然训练集都更大,但是都不是对于小数据集的扩展,而是重新随机采样了更大的数据集。不过这两次实验的训练集是相同的。这个现象很有意思。更大的训练集使得测试集精度上升比较好理解,但是为什么更大的训练集也会造成测试集精度下降呢?也许是因为更大的训练集包含了更多与测试集不同的分布。...原创 2021-03-11 12:52:55 · 761 阅读 · 0 评论 -
股票量化分析系统浅析之(四)框架之间的徘徊
有一阵子没写了,最近一段时间做了一二十个不同的模型,在使用的过程中得经常在这些模型之间进行切换,为了测试不同日期的信号、测试不同范围的代码、测试不同组合的特征,以及配置不同文件的存储目录等各种工作,要修改的参数很多,精神不好的时候就容易出现遗漏或者错改的情况。为了尽量减少人工劳动,就很有必要统一管理这些参数,避免一个模型构建一个类。2019年初到2020年初利用方差法和随机森林的方法配合使用进行特征选择,效果感觉还可以,可惜2020年没过几个月固态硬盘毁了,很可能已经没有备份了。...原创 2021-02-09 00:49:24 · 793 阅读 · 0 评论 -
股票量化分析系统浅析之(三)归一化与标准化
归一化广义上是包含标准化的,本文从狭义上区分两者。归一化主要是应用于没有距离计算的地方上,标准化则是使用在不关乎权重的地方上,因为各自丢失了距离信息和权重信息。从概念上看,标准化将数值规约到(0,1)或者是(-1,1)区间,而归一化将对应数据的分布规约在均值为0,标准差为1的分布上。标准化公式为(x-xmin)/(xmax-xmin),即先使用最小值平移,后使用最值差缩放。归一化公式为(x-均值)/标准差,即先使用均值μ平移,之后用标准差σ进行缩放。标准化丢失了数据的分布信息,对数据之间的距原创 2021-01-20 07:10:33 · 3750 阅读 · 0 评论 -
股票量化分析系统浅析之(二)初步构建训练集并进行训练
上一篇文章讲解了如何构建一个REST Web Service,由于突然在训练方法上有了新的突破,因此准备先放一放构建服务端,继续在训练这一块下点功夫。2020-12-1510:53 由简到繁,先拿一个代码作为例子进行构建。之前写的代码生成的是txt文件,为了适应更多场景,再写一个生成csv版本的方法。11:25 csv文件构建成功,效果如下图所示:部分数据截图11:30 直接生成csv文件很方便,只用将后缀从txt修改为csv就可以了,而选择用将txt转化为csv的方法需要下载java原创 2020-12-26 21:46:27 · 298 阅读 · 0 评论 -
股票量化分析系统浅析之(一)JAX-RS
准备将我前期做的一些计算功能做成接口放到服务器上以供更多的人调用,所以开始研究如何使用webservice,虽然十二年前我就接触了这个技术,可惜一直没有想清楚有什么东西可以放到服务器上。今年年初在别的平台上做了一些尝试,比如微信公众号,可是文本加图片的方式毕竟不容易展示五花八门的数据。新建web services的时候看到Configuration里面的Apache Axis被打上了Deprecated的印记,于是就去找找看有没有什么更好的替代品,找了一阵子只找到了Axis2,对这一块的技术栈不是很原创 2020-12-12 19:10:41 · 657 阅读 · 0 评论
分享