
量化交易
文章平均质量分 86
量化风云
这个作者很懒,什么都没留下…
展开
-
量化金融人都在看哪些顶刊
精选了 7 种量化金融人都在看的顶刊,从最经典的有效市场假说理论,到最新的关于加密货币的研究,都发表在这些期刊上。原创 2024-08-03 21:35:25 · 1452 阅读 · 0 评论 -
QuanTide-weekly第1期
这周我们共发表5篇文章。等两篇详细讲解了机器学习构建组合策略的框架和常见问题。这两篇文章我们也集结后,发在本文末尾。在这一期的量化工具专栏中,我们发表了。IPython是非常轻量的交互式编程工具,尽管它的所有功能都可以在Notebook中找到,但它更轻,但仍然长袖擅舞,颇有飞燕之姿。在中,我们披露了《Python高效编程实践指南》出版过程中的一些冏事。这本书会对量化人构建稳健的交易系统非常有帮助。原创 2024-08-03 21:32:04 · 1293 阅读 · 0 评论 -
圣杯依然闪耀 --基于短时RSI的均值回归策略跑出30%年化
圣杯依然闪耀 RSI 永远是我最爱的指标 – 因为潮汐和回归是这个蓝色星球的生命年轮,这样的轮回也存在于交易世界。而 RSI 就是刻画市场中的潮汐和回归的最好指标之一。原创 2024-07-23 14:48:05 · 1737 阅读 · 0 评论 -
pandas高级技巧之多级索引和分组操作
在量化领域,Pandas是不可或缺的工具,它以强大的数据处理和分析功能,极大地简化了数据操作流程。今天我们介绍两个技巧,都跟因子检验场景相关。第一个技巧是日期按月对齐;第二个是如何提取分组的前n条记录。讲解的概念涉及到group操作、索引的frequency概念以及多级索引的操作(读取和删除)。在最后一个例子中,更是反复使用了groupby,以简洁的语法,完成了一个略为复杂的数据操作。原创 2024-07-20 13:07:04 · 1071 阅读 · 0 评论 -
问薪无愧!最全威的量化自学路线图
这是 Stat Arb 给独立自学量化的人开的一份清单。他的博客有 9000 多名付费用户,在量化圈比较有影响力。这个清单是 pdf 格式,74 页,内容非常全面。原创 2024-07-18 16:07:23 · 791 阅读 · 0 评论 -
高端的食材,往往只需要最简单的烹饪!ORB,仅此一招,Alpha达到年化36%
常常看到有人提问,如何挖掘因子和策略?ORB 策略的改进历史能给我们许多启发。一是一个策略值得研究数十年;二是温故而知新是永远的法宝。沉下心来,真正吃透 IT 系统、吃透数据和已有策略,比追风要好得多。炒股要炒大热门,但对大热门的追踪,不一定是要通过文本分析。如果你对本文引用的资源感兴趣,请转发本文后领取这个策略来自 Carlo Zarattini 等人,在 Quantpedia 2023 年大赛中获第三名。原创 2024-07-16 09:53:31 · 1155 阅读 · 0 评论 -
不能求二阶导的metrics,不是好的objective?!
今天我们要分析 MAPE 这个函数在论文中的使用。以此为契机,适当深入一点机器学习的原理,讲以下两个知识点:1. 损失函数和度量函数2. XGBoost模型,因子数据是否要标准化。原创 2024-07-16 07:30:00 · 2409 阅读 · 0 评论 -
基于 XGBoost 的组合策略基本框架
如何在投资组合策略中运用上机器学习方法? 最近,我们翻了下之前存过的论文,决定对《A portfolio Strategy Based on XGBoost Regression and Monte Carlo Method》这篇论文进行解读原创 2024-07-15 07:30:00 · 1028 阅读 · 0 评论 -
顶底背离的终极猜想和运用
对高频量化,他们看的是tick级数据,可能持有几分钟就会调仓;散户和量化多在日线和周线频率上操作,持有数天就调仓;长线资金以季度为单位。越是长线的资金,资金量越大,调仓时对走向的影响越强。现在,你应该已经猜到了,有一部分资金会在日线RSI高点时撤出;大量的资金会在周线的RSI高点撤出;而更大量的资金会在月线的RSI高点撤出。但我猜没有资金会根据季线的RSI高点撤出。许多真理,都不能线性外推。原创 2024-06-02 22:02:06 · 1520 阅读 · 0 评论 -
机器学习(XgBoost)预测顶和底
之前的文章中,我们对中证1000指数进行了顶和底的标注。这一篇我们将利用这份标注数据,实现机器学习预测顶和底,并探讨一些机器学习的原理。我们选取的特征非常简单–上影线和WR(William’s R)的一个变种。他们的结论是,根据这两类指标的变种得到的综合因子,在2009到2020年4月,以全A为样本,进行5组分层多空测试,得到,可以说具有非常明显的信号意义。原创 2024-04-23 21:43:27 · 1495 阅读 · 0 评论 -
新国九条下,低波动因子重要性提升!
人迹罕至的道路,有时提供更好的旅程。**新国九条之后,红利股在投资中的重要性将大大加强**,而低波动因子在发现红利股、白马股方面有优秀的选择能力。如果一个市场里的财务数据不那么可靠,那么我们就应该使用低波动因子来代替价值因子。**量价数据永远不说谎**。如果一家过去看起来很好的公司,最近出了问题,看财报的人永远是最后一个知道的。但股价会提前反映。原创 2024-04-23 21:39:32 · 899 阅读 · 0 评论 -
为了机器学习量化策略,我标注了两万条数据
很多人对基于机器学习的量化策略很好奇,常常问什么时候有机器学习的课。其实,对很多人(我自己就是)来说,没有能力改进机器学习的算法和框架,机器学习都是作为黑盒子来学习,难度主要是卡在训练数据上。这篇文章,将介绍一种数据标注方法和工具。原创 2024-04-20 22:25:46 · 1017 阅读 · 0 评论 -
如何确定这就是底部?量化分析提供了概率证据
3月28日那篇文章分析了前一日的下跌为什么是可能预见的。这一篇文章,我将用坚实的统计数据,说明这一天为什么应该抄底,预期的损益比又是多少。原创 2024-04-11 08:51:16 · 758 阅读 · 0 评论 -
大跌原因找到了!不是国足输球!
周日莫斯科的恐袭,让所有的A股交易者捏了一把汗,怕不是我A又要买单?果然,短短三日,沪指跌去1.8%,中证1000跌去5.89%,亏钱效应还是非常明显的。痛定之后,留下几个复盘问题,首先是,下跌的原因是什么?当然,我们求解的方法,都是量化思路。原创 2024-03-28 07:15:00 · 779 阅读 · 0 评论 -
7因子模型,除了规模、市场、动量和价值,还有哪些?
这篇文章的源起是有读者问,七因子模型除了规模、市场、动量和价值之外,还包括哪几个因子?就这个题目,正好介绍一下Fung & Hsieh的七因子模型。七因子模型一般是指David Hsieh和William Fung于2004年在一篇题为《Hedge Fund Benchmarks: A Risk Based Approach》中提出的7 factor model。原创 2024-03-27 07:15:00 · 2207 阅读 · 0 评论 -
4k stars! 如何实现按拼音首字母查询证券代码?
一个可能只有少数量化人才需要的功能 -- 按拼音首字母来查找证券。比如,当我们键入ZGPA时,就能搜索出中国平安,或者是它的代码。这是我们使用行情软件时常用的一个功能。原创 2024-03-25 07:15:00 · 1665 阅读 · 0 评论 -
提速100倍!QMT复权信息因子化的高效算法
QMT的XtQuant库提供了量化研究所需要的数据。它在一些API设计上面向底层多一些,应用层在使用时,还往往需要进行一些包装,比如复权就是如此。这篇文章介绍了将XtQuant的除权信息转换成常常的复权因子的高性能算法。与官方示例相比,速度快了100多倍。原创 2024-03-11 07:15:00 · 1328 阅读 · 0 评论 -
后见之明!错过6个涨停板之后的复盘
在今年1月2日和1月3日,旅游板块两支个股先后涨停,此后一支月内三倍,另一支连续6个涨停。事后复盘,我们如何在1月2日第一支个股涨停之后,通过量化分析,找出第二支股?原创 2024-03-08 07:15:00 · 1962 阅读 · 0 评论 -
从分数制到十进制,美股交易规则的改变如何影响到量化策略?
笔记左数效应、整数关口与光折射中引用了南加州大学Lawrence Harris的一篇论文中,哈理斯研究了交易价格的聚类效应。聚类效应对我们确定压力位、完善下单算法都有一定的影响。但是,2001年,美股变更交易制度,由分数制切原创 2024-01-26 08:00:00 · 1081 阅读 · 0 评论 -
来自世坤!寻找Alpha 构建交易策略的量化方法
推荐这本《Finding Alphas: A Quantitative Approach to Building Trading Strategies》。我拿到的PDF是2019年的第二版。来自WorldQuant(世坤)的Igor Tulchinshky。原创 2024-01-25 08:00:00 · 1655 阅读 · 0 评论 -
左数效应 整数关口与光的折射
常常有人问,新的因子/策略从哪里来?今天的笔记或许能启发你的思路。从1932年起,研究人员就注意到以9结尾的价格(比如$3.99),在消费者的认知中,要远远小于邻近的整数价格($4.00)。后来这一效应被称为 left-digit effect。在证券交易中,类似的情况一样存在,不过它的表现形式是整数关口压力。原创 2024-01-24 08:15:00 · 1356 阅读 · 0 评论 -
龙凤呈祥!如何用量化分析方法发现这种无厘头炒作?
2023年底,市场开始炒作龙字,后来又开始炒凤字,被戏称为龙凤呈祥。2024年的年度汉字可能是华。这是一种魔幻和无厘头的炒作。但就像一年有四季一样,A股一年至少会这样魔幻地炒一次。在历史上并不罕见。老股民会记得在2018年底,2019年初,出现了一支十倍牛股,东方通信。它带动了对”东方“这个词的炒作。一时间,只要标的名称中带有”东方“两字的,都能沾上一点雨露。原创 2024-01-23 11:20:16 · 1632 阅读 · 0 评论 -
Clickhouse: One table to rule them all!
前面几篇笔记我们讨论了存储海量行情数据的个人技术方案。它们之所以被称之为个人方案,并不是因为性能弱,而是指在这些方案中,数据都存储在本地,也只适合单机查询。数据源很贵 -- 在这个冬天,我们已经听说,某些上了规模的机构,也在让员工共享万得账号了。所以,共享网络存储,从而只需要一个数据账号,就成为合理的需求。更不必说,集中管理才可能让 IT 来进行数据维护,而分析师只需要专注于策略就好。原创 2024-01-17 10:20:20 · 1342 阅读 · 0 评论 -
量化交易简介,多图慎入!
量化交易课程导论原创 2024-01-14 23:46:52 · 510 阅读 · 0 评论 -
2024年初私募量化策略大盘点
因子挖掘还是以手工为主,最有效的因子(策略)仍然是技术类的趋势+反转,无论是CTA还是量化多头都是如此。模型构成基本上都是机器学习。其中树模型比神经网络占比更大一些,有的机构中使用率高达90%。原创 2024-01-15 08:00:00 · 552 阅读 · 0 评论 -
Alphalens因子分析(4) - Information Coefficient方法
在前面的笔记中,无论是回报分析,还是因子Alpha,它们都受到交易成本的影响。信息分析 (Information Analysis)则是一种不受这种影响的评估方法,主要研究方法就是信息系数(Information Coefficient)。原创 2024-01-12 08:00:00 · 1735 阅读 · 0 评论 -
因子分析(3)- 都是坑!这么简单的Alpha计算,竟然错了?!
我们继续 Alphalens 因子分析报告的解读。在过去的两篇笔记中,我们都提到,运用 Alphalens 进行因子分析步骤很简单,但是如果不了解它背后的机制与逻辑,很容易得到似是而非的结论。原创 2024-01-11 08:15:00 · 1687 阅读 · 0 评论 -
Alphalens因子分析(2) - 低换手率因子秒杀98%的基金经理?
上一篇笔记,我们已经为因子分析准备好了数据。这一篇笔记,我们就进行因子分析。分析过程在 Alphalens 中非常简单,核心是读懂它的报告。原创 2024-01-10 09:30:00 · 1523 阅读 · 0 评论 -
Alphalens 因子分析 - 以低换手率因子为例(1)
因子分析是量化研究的基本技能之一。通过因子分析,找出有效的因子,通过相关性去重后,就可以通过机器学习、线性回归等方法把因子组合起来,构成交易策略。这一篇笔记我们就介绍如何使用 Alphalens 来进行单因子分析。我们使用的因子是低换手率因子。原创 2024-01-09 08:00:00 · 1632 阅读 · 0 评论 -
广义双曲分布、KS检验与抄底沪指
上一篇笔记我们抛出一个问题,沪指大跌 4%时,能不能抄底?今天的笔记,我们就通过 KS 检验,找出沪指的概率分布,进而回答这个问题。在后面的笔记中,我们还将换一个方法继续回答这个问题。原创 2024-01-05 08:00:00 · 1299 阅读 · 0 评论 -
Z-score 因子的深入思考
最新(2024 年 1 月)出版的 SC 技术分析(Techical Analysis of Stock & Commodities)的第 4 条文章给到了 Z-score,原文标题为《Z-score: How to use it in Trading》。今天的笔记,就借此机会,同步推出我们对通过Z-score来构建量化因子的一些观点。原创 2024-01-04 08:00:00 · 1717 阅读 · 0 评论 -
存了50TB!巨能“装”的量化数据存储方案
Apache Arrow是一种基于列向量的内存存储格式。Pyarrow是基于Arrow的一个封装库,实现IO,计算和提供表格视图。通过Pyarrow,可以提供TB级的量化交易数据存储。原创 2024-01-02 23:00:15 · 1499 阅读 · 0 评论 -
200倍速!基于 HDF5 的证券数据存储方案
1. hdf5是一种存储和处理大容量科学数据的文件格式及相应库 2. hdf5的读写速度是csv的数百倍。在240M记录中进行查找,速度约为0.2秒。 3. 读取hdf5文件的python库是h5py 4. 行情数据应该按周期创建群组。子数据集以证券代码为key。 5. 介绍了创建、查询和追加行情数据到hdf5文件中。 6. 增强hdf5性能的几种方式。原创 2024-01-02 07:30:00 · 2090 阅读 · 0 评论 -
羊群效应及其因子化
在之前的笔记中,我们多次将现代金融理论与A股中流行的股谚、规律和大V的经验之谈结合起来,我们戏称为现代金融理论的中国化。本篇笔记将继续沿着这一思路展开,介绍羊群效应,以及在A股中,它有哪些表现,如何实现因子化,等等。今天我们要介绍的股谚,是养家心法中的一条,得散户者得天下,它实际上讲的是要充分利用羊群效应。原创 2023-12-28 07:30:00 · 1163 阅读 · 0 评论 -
XtQuant中的板块数据
xtquant 是一个 Python 库,提供了行情数据和实盘接口。只要您的券商支持 QMT,并且您也申请到了量化接口权限,就可以免费使用这些数据和实盘接口,这也是目前性价比较高、门槛较低的接入方式。因此,我们会通过多篇笔记来介绍这个库。今天要探索的是,xtquant 中的板块是如何组织的。这部分内容,虽然在官方文档有一些介绍,但并没有把 API 的使用串联起来。有一些知识点也是经询问官方才知道的,可能一段时间内,这仍然是**独家资料**,值得收藏。原创 2023-12-27 07:30:00 · 2154 阅读 · 0 评论 -
股市中的Santa Claus Rally (圣诞节行情)
Santa Claus Rally 是指 12 月 25 日圣诞节前后股市的持续上涨这样一个现象。《股票交易员年鉴》的创始人 Yale Hirsch 于 1972 年创造了这个定义,他将当年最后五个交易日和次年前两个交易日的时间范围定义为反弹日期。原创 2023-12-25 08:00:00 · 2012 阅读 · 0 评论 -
NHNL因子如何刻画行业强弱
这样就出现了熊市不言底,牛市不言顶的规律,或者说新高之后还有新高,新低之后还有新低的股谚。XtQuant是迅投研发的行情数据及实盘接口,开通量化权限的话,可以免费获得行情数据,因此它是又一个优秀的免费数据源。但是,行业指数作为多个随机变量的叠加,就会出现一定的规律性(受A4系统性影响的偶然性我们先排除在外,毕竟也不是天天有A4)。今天要介绍的净新高占比因子,可以用来捕捉行业强弱趋势以及反转,以此因子为基础,我们可以构建指数增强策略。)为基准,视自己的账户是处于浮盈还是浮亏状态,来确定自己的操作。原创 2023-12-23 21:15:29 · 1211 阅读 · 0 评论 -
周末轻松学量化 | 球队和硬币因子
球队和硬币因子最初来自于耶鲁大学 Tobias Moskowitz 的发表于 2021 年 9 月的一篇论文,发布以来,得到了超过 14 次以上的引用。这篇论文名为《Asset Pricing and Sports Betting》。Moskowitz 从这样一个现象开始:当人们抛一枚硬币时,如果上次抛出了正面,人们倾向于猜测下次是反面;而当球赛的一个新赛季开始时,人们更倾向于猜测上赛季的冠军,依旧会在本赛季夺冠。为什么会出现这种差别呢?原创 2023-12-23 08:00:00 · 1439 阅读 · 0 评论 -
QMT/XtQuant 之开发环境篇
笔记要点 1. XtQuant 获取及安装 2. XtQuant 工作原理 (图2) 3. 版本和文档一致性问题 (图3) 4. 使用 VsCode 远程开发原创 2023-12-21 22:58:28 · 919 阅读 · 1 评论 -
Connor‘s RSI: 我愿称之为年度最伟大的指标
人们发明了各种技术指标。这些技术指标中,以价格因子居多,比如均线、ATR、MACD, RSI, JDK等。由于拥挤效应的存在,多数因子的有效性也越来越弱,或者说,它们的使用范围也越来越局限。但有一个因子,是基于著名的RSI的改进版。如果说在多因子时代,我们可以仅凭一个因子就构建出策略,并且还很有可能跑赢市场的话,它是不二之选。原创 2023-12-21 22:08:57 · 1516 阅读 · 1 评论