中金万字长文,说透大模型!读懂行业新思路,看这一篇就够了!

摘要: 为什么关注行业景气模型

行业盈利预测对股价收益表现有增益效果。股票长期收益率可以拆解为股息率、盈利增长率、市盈率变化三大因素。从收益构成来看,股息率依赖公司的持续盈利和分红意愿;市盈率变化体现市场愿意为盈利支付的价格变化;盈利增长率则是股票价值增长的核心驱动力,且相较于市盈率变化更具有可预测性。

预测盈利增速有助于增强行业组合收益表现。假设我们能提前一个季度知道未来行业的盈利增速,同时对盈利增速进行市值中性化后构建未来盈利高增速行业组合,该组合收益表现整体优于行业等权组合和未来盈利低增速行业组合,体现出预测盈利增速可对行业组合提供一定的超额收益。

行业景气模型从中观维度反映未来行业盈利状态。行业景气模型通过需求、供给等中观指标反映行业的基本面状态,从而预测行业未来的盈利表现,最终为股价收益预测提供一定支撑。

LLM提高行业景气模型的构建效率。而LLM可以帮助我们在定性分析的环节内提高指标筛选效率,快速识别符合行业基本面逻辑的核心指标,从而实现行业景气模型构建在全行业范围的推广。

1.LLM赋能,构建行业景气模型

基于LLM在指标筛选环节的优势,我们设计了一套行业景气模型的构建流程,借助LLM对行业中观指标进行定性筛选,并进一步开展定量检验,最终合成兼具可解释性与可靠性的行业景气模型,实现对行业利润增速的提前预测。

我们构建的行业景气模型有助于预测未来盈利增速。我们构建了28个中信一级行业及其对应的二级、三级行业的景气指数,并对景气指数的盈利预测效果进行测试。从整体来看,我们构建的景气指数对未来盈利增速有一定的预测能力,其中不同级别行业景气指数对未来盈利增速的秩相关系数的均值和中位数均在0.25左右。此外我们在每个行业内根据景气得分将时间区间等分为五组,统计组数和每组未来盈利增速中位数的秩相关系数作为单调性得分,我们发现存在80%左右的行业利用景气指数对未来盈利增速分组的单调性得分不低于0.5。

2.行业景气指数轮动应用初探

行业景气指数应用场景较为广泛。行业景气指数具有多种运用场景,包括行业择时、行业轮动、行业景气选股、风险预警等等。本节我们将简单展示行业景气指数的单一维度信息对行业轮动策略的增益效果,未来我们将进一步探索行业景气模型的广泛应用场景。

高景气长期表现较优。我们从中信一级、二级、三级行业中分别筛选出高景气行业组合,回测结果显示,在各层级行业中,高景气组合的长期收益表现均相对等权组合具备一定优势。若我们每期选择排名前20%的行业构建月频高景气行业组合,其年化超额收益率在中信一级、二级、三级行业中分别实现2.4%、2.9%、2.8%;排名靠前10%的高景气行业组合的年化超额收益率则可分别实现1.2%、8.1%和3.1%。

风险提示:本篇报告所构建模型均基于历史数据,未来市场发生变化时,模型存在失效风险。

一、行业景气模型有助于行业盈利预测

1.为什么关注行业景气

行业盈利预测对股价收益表现有增益效果。股票长期收益率可以拆解为股息率、盈利增长率、市盈率变化三大因素。从收益构成来看,股息率依赖公司的持续盈利和分红意愿;市盈率变化体现市场愿意为盈利支付的价格变化;盈利增长率则是股票价值增长的核心驱动力,且相较于市盈率变化更具有可预测性。

预测盈利增速有助于增强行业组合收益表现。假设我们能提前一个季度知道未来行业的盈利增速,同时对盈利增速进行市值中性化后构建未来盈利高增速行业组合,该组合收益表现优于行业等权组合和未来盈利低增速行业组合,体现出预测盈利增速可对行业组合提供一定的超额收益。

图表1:未来盈利高增速行业组合回测净值

注:按照中信一级行业分类选择排名靠前或靠后的6个行业构建组合
资料来源:Wind,中金公司研究部

行业景气模型从中观维度反映未来行业盈利状态。行业景气模型通过需求、供给等中观指标反映行业的基本面状态,从而预测行业未来的盈利表现,最终为股价收益预测提供一定支撑。

图表2:行业景气模型目标

资料来源:中金公司研究部

2.LLM有助于提高行业景气模型构建效率

围绕交运行业搭建了景气模型框架。具体步骤为:

► 基于行业逻辑定性筛选部分具有代表性的中观指标;

► 通过格兰杰因果、相关性等检验完成指标的定量筛选;

► 定性角度从通过定量检验的指标池中筛选出反映行业基本面的核心指标,从而合成交运行业景气指数。

LLM提高行业景气模型的构建效率。在交运行业景气模型的构建中,我们在基本面逻辑定性分析与最终指标筛选环节均投入了大量时间成本。而LLM可以帮助我们在定性分析的环节内提高指标筛选效率,快速识别符合行业基本面逻辑的核心指标,从而实现行业景气模型构建在全行业范围的推广。

图表3:行业景气模型构建流程

资料来源:中金公司研究部

我们将基于中信一级、二级、三级行业分类,利用中金点睛数据库的中观行业指标数据与LLM构建行业景气模型,以期实现对行业盈利增速的提前预测,从而提升行业配置策略超额收益的获取能力。

二、LLM赋能,构建行业景气模型

1.行业景气模型构建全流程

基于LLM在指标筛选环节的优势,我们设计了一套行业景气模型的构建流程,借助LLM对行业中观指标进行定性筛选,并进一步开展定量检验,最终合成兼具可解释性与可靠性的行业景气指数,实现对行业利润增速的提前预测。

1.1LLM筛选行业逻辑

利用中金点睛数据库,获取影响行业基本面的中观指标。我们将利用中金点睛数据库,对中信一、二、三级行业分别筛选描述其基本面状态的行业中观指标。由于综合及综合金融板块对应的中观数据相对缺乏,因此我们将不对其行业的景气模型进行覆盖。

LLM初筛行业中观指标。我们使用LLM对大量的行业中观指标进行初步筛选,从而选择符合对应行业基本面逻辑的指标进行后续检验。本文我们使用火山引擎DeepSeek-R1接口,输入中金点睛数据库中的对应行业指标名称,进而让LLM帮我们定性筛选符合基本面逻辑的中观指标。

重复训练叠加相关性筛选,增强指标初筛的全面性。为了尽可能降低LLM输出结果的随机性对指标筛选造成的负面影响,对于每一个行业,我们将用LLM重复训练三次,每次选取近20个指标,进而更可能全面的保留影响该行业基本面的核心指标。此外,对于每一个LLM筛选出的指标,我们将计算该指标和其余数据库指标之间的相关性,进一步保留相关性得分高的中观指标。

图表4:LLM定性初步筛选行业中观指标

资料来源:中金公司研究部

图表5:prompt示例

资料来源:中金公司研究部

1.2指标有效性定量测试

我们将对LLM定性初步筛选出的原始指标数据进行预处理和定量检验,从而进一步筛选出具有行业利润预测能力的中观指标。

标准化数据,剔除极端数据影响。我们在数据预处理过程中对指标进行简单变形,除了保留同比或环比的原值数据,还进一步计算指标的同比、环比和五年分位数。此外,我们对同比、环比数据进行截尾,从而剔除极端数据的影响。

搭建解释性检验框架,检验指标的合理性与可靠性。为定量验证各类指标对行业净利润增速的解释能力,我们对各指标进行以下检验:

► 格兰杰因果检验。格兰杰检验是用来分析经济变量时间序列是否存在因果关系的工具,其核心思想是:即使已考虑变量Y自身的历史数据,如果变量X仍对Y的当前值有解释能力,那么X就是Y的格兰杰原因。因检验需要平稳数据,我们对各指标先做了单位根检验,我们以10%为显著性标准,检验系数的显著性低于此值即通过检验。

► 相关性检验。我们计算指标与未来1至3个月的净利润增速之间的相关系数,量化其解释作用。若检验结果显示两者存在显著相关性,则判定该指标具备较强的净利润解释能力。

图表6:解释性检验框架流程

资料来源:中金公司研究部

1.3LLM核验指标逻辑

LLM精筛行业核心景气指标。为了精准描述行业景气表现,我们将通过前期LLM初步筛选和定量检验的指标再一次输入LLM中,这一次我们将让LLM精准筛选描述对应行业景气的核心指标。LLM初筛和精筛的主要区别在于,初筛旨在广泛筛选出所有具有一定相关性的指标去进行定量检验,而精筛则聚焦于进一步筛选影响行业基本面的核心指标。同理为了降低LLM随机性的影响,我们将用LLM重复训练三次。

图表7:LLM定性精筛行业中观指标

资料来源:中金公司研究部

LLM叠加相关性测试判断指标极性。我们将使用LLM和相关性双重检验的方式判断指标极性,若在LLM判断指标对净利润的影响方向下,指标与净利润的相关系数表现良好,我们则保留该指标,并对其进行相应的极性调整。

中观指标合成行业景气指数。在利用LLM定性筛选和定量检验后,我们对于每一个行业都筛选了近5个指标。在处理每个中观指标时,我们首先保留与净利润相关性最高的变形类别,然后依据指标的相关性进行打分并分组。最终,我们基于同分组等权原则对各组指标进行合成,得出行业景气指数。

1.4行业景气模型预测效果

我们构建的行业景气指数有助于预测未来盈利增速。基于上述完整流程,我们构建了28个中信一级行业及其对应的二级、三级行业的景气指数,并对景气指数的盈利预测效果进行测试,统计结果如下表所示。从整体来看,我们构建的景气指数对未来盈利增速有一定的预测能力。

从相关性角度来看,行业景气指数对未来盈利增速的相关性分布整体表现良好。整体来看,一级、二级、三级行业间的行业景气指数和未来盈利增速之间具有一定相关关系,其中不同级别行业景气指数对未来盈利增速的秩相关系数的均值和中位数均在0.25附近。

图表8:行业景气指数与未来盈利TTM同比增速秩相关统计

注:样本期间为2010-01-01至2025-10-31

资料来源:Wind,中金点睛数据库,中金公司研究部

图表9:行业景气指数与未来盈利TTM环比增速秩相关统计

注:样本期间为2010-01-01至2025-10-31
资料来源:Wind,中金点睛数据库,中金公司研究部

景气指数分组统计未来盈利增速单调性较为显著。我们在每个行业内根据景气得分将时间区间等分为五组,从而计算每个行业每组未来一个季度的盈利增速中位数,统计组数和每组未来盈利增速中位数的秩相关系数作为单调性得分。我们发现利用景气指数分组统计未来盈利增速的单调性较为显著,即景气偏低的时间段未来盈利增速表现欠佳,而景气偏高的时间段未来盈利增速表现相对良好。其中一级、二级和三级行业分类中均有80%左右的行业对未来盈利增速分组的单调性得分不低于0.5。

图表10:行业景气指数分组统计未来盈利TTM同比增速中位数

注:样本期间为2010-01-01至2025-10-31

资料来源:Wind,中金点睛数据库,中金公司研究部

图表11:行业景气指数分组统计未来盈利TTM环比增速中位数

注:样本期间为2010-01-01至2025-10-31
资料来源:Wind,中金点睛数据库,中金公司研究部

图表12:行业景气指数分组与未来盈利增速中位数单调性得分不低于0.5的占比统计

注:样本期间为2010-01-01至2025-10-31
资料来源:Wind,中金点睛数据库,中金公司研究部

我们以有色金属行业为例,展示最终构建的行业景气指数走势表现。下图的有色金属行业景气指数与净利润环比增速和同比增速的秩相关性系数分别为0.50和0.63,其行业景气指数走势与未来净利润增速走势近似。

图表13:有色金属行业景气指数与盈利增速走势

注:样本期间为2010-01-01至2025-10-31
资料来源:Wind,中金点睛数据库,中金公司研究部

2.行业景气指数轮动应用初探

行业景气模型应用场景较为广泛。行业景气模型具有多种运用场景,包括行业择时、行业轮动、行业景气选股、风险预警等等。在行业择时层面,景气指数可为行业配置时机提供决策依据;在行业轮动层面,景气指数表现可以从未来盈利预测维度为行业筛选提供建议;在个股选择层面,可优先使用景气指数筛选高景气或低景气的行业范围,为后续构建股票策略提供基础股票池。

图表14:行业景气指数的应用场景

资料来源:中金公司研究部

本节我们将简单展示行业景气指数的单一维度信息对行业轮动策略的增益效果,未来我们将进一步探索行业景气模型的广泛应用场景。

构建景气指数单一维度行业轮动策略。我们将在中信一级、二级、三级行业中,分别选出景气指数排名靠前的行业和靠后的行业构建高景气行业组合与低景气行业组合。我们根据数量占比和换仓频率进行敏感性测试,发现整体在各层级行业中,高景气组合的长期收益表现相对低景气和等权组合具备一定优势。

图表15:高景气行业组合年化收益率敏感性测试(数量筛选)

注:样本期间为2010-01-01至2025-11-14

资料来源:Wind,中金点睛数据库,中金公司研究部

图表16:高景气行业组合超额收益率敏感性测试(数量筛选)

注:样本期间为2010-01-01至2025-11-14
资料来源:Wind,中金点睛数据库,中金公司研究部

图表17:高景气行业组合年化收益率敏感性测试(换仓频率)

注:样本期间为2010-01-01至2025-11-14

资料来源:Wind,中金点睛数据库,中金公司研究部

图表18:高景气行业组合超额收益率敏感性测试(换仓频率)

注:样本期间为2010-01-01至2025-11-14
资料来源:Wind,中金点睛数据库,中金公司研究部

二、三级行业单一维度高景气行业轮动策略收益表现良好。我们发现在敏感性测试中,二、三级行业景气轮动的收益表现整体优于一级行业。

► 行业景气预测准确性差异:我们测试了中信一、二、三级行业景气指数与未来一个季度盈利增速的相关性分布,其中三个级别行业的相关性分布得分近似,因此仅凭景气指数刻画的准确性,较难得出二、三级行业轮动效果更优的结论。

► 行业投资宽度差异:我们一共构建了28个一级行业、104个二级行业和271个三级行业景气指数。我们假设完全准确预测未来各行业的盈利表现,并根据市值中性化后的未来盈利增速,在每个级别行业内部筛选排名前20%的行业构建未来高景气轮动策略,我们发现二级和三级行业的整体超额收益表现要优于一级行业。因此从投资宽度的角度出发,我们认为二级和三级行业或具有一定优势。

图表19:行业景气指数与未来盈利TTM环比增速相关性统计

资料来源:Wind,中金点睛数据库,中金公司研究部

图表20:未来盈利高增速行业组合相对等权组合的净值走势

资料来源:Wind,中金公司研究部

高景气行业组合超额收益长期较为稳定。我们每期选择排名前20%的行业构建月频高景气行业组合展示其长期收益走势,我们发现相较于等权行业组合高景气行业组合长期收益表现较为稳定。

图表21:高景气行业组合净值走势(一级行业)

注:样本期间为2010-01-01至2025-11-14

资料来源:Wind,中金点睛数据库,中金公司研究部

图表22:高景气行业组合净值走势(二级行业)

注:样本期间为2010-01-01至2025-11-14
资料来源:Wind,中金点睛数据库,中金公司研究部

图表23:高景气行业组合净值走势(三级行业)

注:样本期间为2010-01-01至2025-11-14
资料来源:Wind,中金公司研究部

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费

在这里插入图片描述

### BERT 模型的核心原理与架构 BERT(Bidirectional Encoder Representations from Transformers)是一种基于 Transformer 架构的预训练语言模型,其核心优势在于能双向理解语言上下文。与传统的单向语言模型不同,BERT 在处理输入文本时,同时考虑了左侧和右侧的上下文信息,从而更全面地捕捉语义[^1]。 #### 预训练任务:MLM 与 NSP BERT 的预训练包含两个主要任务:Masked Language Model(MLM)和 Next Sentence Prediction(NSP)。 - **MLM(Masked Language Model)**:该任务旨在帮助 BERT 理解句子内部的上下文。具体来,在训练过程中,输入文本中 15% 的词会被随机屏蔽(mask),模型的任务是根据上下文预测这些被屏蔽的词。这种机制使得 BERT 能学习到更丰富的语义表示,而不是仅仅依赖于单向的语言模型[^1]。 - **NSP(Next Sentence Prediction)**:除了句子内部的语义理解,BERT 还通过 NSP 任务来掌握句子之间的关系。在训练过程中,模型会接收到两个句子作为输入,并判断第二个句子是否是第一个句子的后续句。这种机制增强了 BERT 对长文本结构的理解能力,使其在处理问答、文本蕴含等任务时表现更佳[^1]。 #### BERT 架构 BERT 的基础架构基于 Transformer 的编码器部分,采用了多层自注意力机制(Self-Attention)和前馈神经网络。BERT 提供了两种主要版本: - **BERT-Base**:包含 12 层编码器,每层有 12 个注意力头,总参数量约为 1.1 亿。 - **BERT-Large**:包含 24 层编码器,每层有 16 个注意力头,总参数量约为 3.4 亿。 每个输入 token 会被映射为三个嵌入向量的和:词嵌入(Token Embedding)、位置嵌入(Position Embedding)和段嵌入(Segment Embedding)。其中,段嵌入用于区分两个不同的句子(如在 NSP 任务中)。 #### 微调与下游任务应用 BERT 的最大优势在于其强大的迁移学习能力。通过在大规模语料上进行预训练后,BERT 可以在各种 NLP 任务中进行微调(Fine-tuning),包括: - **文本分类**:如情感分析、新闻分类等; - **命名实体识别(NER)**:识别文本中的实体如人名、地名、组织机构等; - **问答系统**:如 SQuAD 数据集上的问答任务; - **自然语言推理(NLI)**:判断两个句子之间的逻辑关系。 在微调过程中,通常只需在 BERT 输出的基础上添加一个简单的分类层或解码层,并对整个模型进行端到端的训练。这种方式显著提升了模型在下游任务上的性能。 #### BERT 的影响与演进 BERT 的提出对 NLP 领域产生了深远影响,促使了大量改进模型的出现,如 RoBERTa、ALBERT、DistilBERT 等。这些模型在不同方面优化了 BERT,例如 RoBERTa 移除了 NSP 任务并增加了训练数据量,ALBERT 通过参数共享减少了模型参数量,而 DistilBERT 则专注于模型压缩和推理速度的提升[^1]。 此外,随着研究的深入,还出现了如 Mixture of Experts(MoE)等结构创新,以及 LoRA 等参数高效微调技术,这些都进一步推动了 BERT 类模型的性能提升和应用扩展[^2]。 ### 示例代码:使用 Hugging Face Transformers 加载 BERT 模型 以下是一个使用 `transformers` 库加载 BERT 模型并进行文本编码的简单示例: ```python from transformers import BertTokenizer, BertModel import torch # 加载预训练 BERT 模型和对应的 tokenizer tokenizer = BertTokenizer.from_pretrained('bert-base-uncased') model = BertModel.from_pretrained('bert-base-uncased') # 输入文本 text = "BERT is a powerful language model." # 对文本进行编码 inputs = tokenizer(text, return_tensors='pt', padding=True, truncation=True) # 获取模型输出 with torch.no_grad(): outputs = model(**inputs) # 获取最后一层的隐藏状态 last_hidden_states = outputs.last_hidden_state print(last_hidden_states.shape) # 输出形状: [batch_size, sequence_length, hidden_size] ``` ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值