- 博客(11)
- 收藏
- 关注
原创 情绪因子|XenonDB情绪因子2019-2021年单因子回测
XenonDB数据库是专业的经济金融时间序列数据库。应用自然语言分析和分布式计算技术,我们对大规模混乱的市场数据进行识别和分析,生成市场和企业各个维度的实时数据,向工业,商业,经济,金融,政务,教学和科研领域的专业人员提供高质量的结构化数据,快速的信息检索,和基于API的高频数据调用。
2023-01-17 17:19:20
351
1
原创 情绪因子 | 大盘的领先指标:雪球情绪指数完整历史回测
前文我们对来源于股吧的情绪指数,通过简单策略以历史股价为基准进行了回测。对于雪球的情绪指数,我们用同样的方法对历史数据进行回测以期能有一些新的发现。
2023-01-17 17:13:38
1136
原创 情绪因子 | 全A情绪指数:市场对大事件的情绪反应
全A情绪指数——在目前已有的情绪指数库上构建出一种能反映市场整体情绪的指标,本文展示了在其构建过程中发现的一些潜在价值以及全A情绪指数是否能对一些重要社会性事件做出反应的研究。
2023-01-17 16:49:05
678
原创 情绪因子|小时级情绪指数:日内高频交易初试
目前,一些国外比较流行的高频日内交易做市策略无法有效地在国内市场实施,除了A股的T+1交易规则,撤单率的限制,印花税偏高等,还有一个重要的原因是:由于预测收益周期很短,所以可用到的数据基本就只限于高频的价量数据和少部分实时的另类数据。整体而言,数据的维度相较于低频策略而言要少很多。而基于这部分数据挖掘出有预测能力的因子大多数时候也很有限,因此,不同机构的策略底层因子构成的相似度其实很高。那么当我们的情绪因子已经能够达到小时或分钟级的颗粒度,我们也希望能为高频市场带来一种创新型的因子来应对策略的同质化。
2023-01-17 16:45:29
684
原创 情绪因子|共线性问题:与T日动量的因子
在情绪因子融入多因子模型中,最常见到的问题是:情绪因子往往会和当日动量因子产生较大共线性,从而导致因子间相互不独立,最终影响多元回归的预测。本文就该问题进行了一系列研究,以期抛砖引玉,提供更多的解决思路。
2023-01-17 16:26:33
322
原创 预训练语言模型|研报情绪API发布
1.介绍预训练大模型:BBT 10亿参数, 微调:3000条标注数据,人工交叉标注三分类标签(正,负,中性)准确度:93%(评判标准:0-0.4为负面,0.4-0.6为中性,0.6-1为正面)继上一篇(预训练语言模型|情绪分析的多样化应用场景)我们分析了不同场景下情绪分析的用处和意义,我们开放了基于BBT大模型的研报情绪分析能力,以API形式调用:
2023-01-17 16:08:31
193
原创 预训练语言模型|情绪分析的多样化应用场景
预训练语言模型|情绪分析的多样化应用场景情绪分析,是目前预训练语言模型被最为广泛运用在量化投资领域的工具之一。量化投资需要将文本数量化,“情绪”便顺理成章,成为很好的中转媒介。在过往时间里,我们在语言预训练领域,尤其文本数据量化,有着长足的积累,在使用过程中,也发现了许多大家共同关心的问题,本文就不同场景下的情绪分析任务,进行系列的探讨,也期望对“情绪分析”这样一个大家已熟知的人工智能场景产生更深刻的理解。
2023-01-17 15:49:10
301
原创 直播预告 | 超对称Above Noise线上沙龙:预训练语言模型在量化投资中的运用
超对称近日推出线上沙龙活动,就如何将预训练语言模型应用到量化投资中进行深度剖析,助您在海量噪声中发现信号,期待您的参与!报名后我们将在直播开始前为您发送观看链接。
2022-07-21 22:30:32
479
原创 让预训练语言模型读懂数字:超对称技术联合复旦知识工场等发布10亿参数BigBang Transformer[乾元]金融大规模预训练语言模型
超对称技术公司发布10亿参数金融预训练语言模型BigBang Transformer[乾元]。BBT大模型基于时序-文本跨模态架构,融合训练文本和时序两种模态数据,跨模态架构能让语言模型识别时序数据的变化并通过人类语言来分析和阐述其发现。.....................
2022-06-11 16:36:22
2647
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人