预训练大模型与金融量化

预训练大模型与金融量化

黄文灏 作者:黄文灏(前北京智源AI研究院 技术负责人)

整理:AINLP公众号

链接:https://zhuanlan.zhihu.com/p/646909899

最近,和朋友讨论到一个有趣的观点:大模型预训练(主要指成本最大的from scratch预训练)和金融量化有很多相似之处。联想到之前幻方提到的做金融量化的人天然具备做预训练大模型的基础。恰好自己同时具有预训练大模型和金融量化的背景,仔细思考一下,发现的确可以做个对比。

大型的系统工程

大多数量化算法的核心数据是公开的量价数据,大模型预训练的数据中最重要的也是公开数据,当然各家都会有一些自己独有的数据来源,但占比都不太大。量化的整体算法逻辑各家其实也都差不多,类比预训练模型结构方面,大家也基本类似,不会有翻天覆地的差别。所以,决定模型能力好坏的其实是大型系统工程能力。

首先,作为大型系统工程,量化和大模型都需要大型的计算集群。上万张卡的互联是对Infra的极致挑战,国内在ChatGPT之前实现上万张卡互联的可能只有幻方的萤火平台,幻方的Infra人才基本上也是国内最顶尖的,里面各种NOI金牌

量化金融大模型量化的侧重点有所不同,并不是完全一样的概念。 **一、量化金融** 1. **定义** - 量化金融是指利用数学、统计学以及计算机科学等手段对金融市场进行研究分析的一门学科。它广泛应用于资产定价、风险管理、投资组合优化等多个方面。例如,在股票市场中,通过构建回归模型预测股价走势;在固定收益领域,运用利率期限结构理论确定债券价格等。 2. **涵盖范围更广** - 它不仅包括了基于各种算法(如传统的线性回归、时间序列分析等小规模模型)的交易策略开发,还涉及到金融机构内部的风险控制体系建立、产品创新设计等内容。从微观层面看,可以针对单只证券或特定客户的需求提供定制化服务;宏观上,则关注整个市场的系统性风险评估等问题。 **二、大模型量化** 1. **侧重于大规模数据处理深度学习技术的应用** - 随着人工智能的发展,“大模型”通常指那些包含大量参数(比如数亿甚至数十亿)、能够挖掘海量非结构化数据潜在规律的人工智能模型,像BERT这样的自然语言处理预训练模型也可归为此列。当应用到量化金融领域时,被称为“大模型量化”。其核心在于借助高性能计算资源及先进的机器学习框架,快速准确地捕捉复杂金融市场环境下的动态变化特征并据此制定相应的投资决策方案。 2. **专注于某些特定类型的策略研发** - 主要是依赖大数据集(新闻资讯、社交媒体情绪倾向信息等非常规来源的数据),采用神经网络架构(卷积神经网络CNN用于图像识别类任务虽然较少直接出现在传统量化场景里,但在一些特殊情况下可用于卫星影像辅助判断自然灾害影响地区股市波动;循环神经网络RNN及其变体LSTM对于处理时间序列型金融数据有独特优势)提取有效因子,进而形成具有前瞻性指导意义的大宗商品期货套利或者高频股票买卖信号生成工具等。 总之,两者存在交叉但又有所区别:所有涉及程序化操作并且以盈利为目标的行为都可以纳入量化金融范畴之内,而所谓“大模型量化”则是在这个基础上进一步强调新型智能化技术超大型数据库支撑下所开展的专业化程度更高的活动形式。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

医疗AI强化曾小健

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值