【招银研究|行业深度】数字金融之AI+银行——大模型与银行数字化转型的三组关系

■ 近年来大模型等AI技术的发展为银行业创造全新的技术赋能路径,有望通过数字化转型提升资产组织效率并降低运营成本。本报告在梳理国内外案例的基础上,层层递进分析大模型与银行数字化转型的三组关系,尝试提出兼具前瞻性和实操性的经营策略,助力银行业应对数字化过程中的不确定性,实现可持续增长。

**■ 第一组关系:大模型基础能力与银行应用场景。**近年来,大模型技术在自然语言处理领域取得三大突破:内容生成、信息提取和对话交互,高度契合银行业的知识密集型特征,驱动其广泛开展场景探索。前台方面,知识库与智能客服迅速落地(某股份行自动生成营销文案,某国有行远程助手将通话时长缩短10%),跨境支付报文的处理也开始引入大模型。中台领域,某银行的“智能授信”将尽调报告撰写时间缩至5分钟,未来有望驱动信贷审查向实时、全面、算法密集型模式转型。后台开发中,多家银行已借助大模型提升代码生成效率。国外银行AI用例与国内大体类似,前中后台占比55%/19%/26%,知识库、运营支持、客户服务与程序开发是主要应用。

**■ 第二组关系:生成式AI与判别式AI。**大模型等生成式AI擅长从非结构化数据创造新内容,但面临运算成本高、结构化数据处理弱、可解释性差等问题;而判别式AI(如逻辑回归、决策树)则在这些方面具有优势,已在银行风控评级中大量应用。未来两类AI或将融合协作,形成两种模式:一是“伞形模式”,即生成式AI作为中枢拆解任务并整合结果,中间环节由判别式AI执行,如某银行通过大模型平台比较不同算法预测企业注销风险的准确性;二是“串联模式”,即两者在同一层级协同工作,前驱模型输出作为后续输入,在信用评分等领域具有发展潜力。全球金融AI标杆摩根大通的技术储备清晰展现出其对于生成式AI与判别式AI的双双重视。

**■ 第三组关系:人工智能与银行数字化转型。**大模型等人工智能技术的应用旨在推动银行数字化转型。然而,转型不仅是技术升级,更依赖业务流程的深度变革,这需要建立在战略规划、组织协同和技术实施的闭环联动之上,实现业务与科技双向赋能。回顾全球银行业五十余年的三次技术创新浪潮,每一次都伴随着流程调整。深层次转型要求金融机构具备全方位变革决心:包括战略层面的顶层设计、长期投入的定力、跨部门协作机制以及科学的推进节奏。这也是释放AI技术价值的必经模式。

■ 银行业经营策略与风险因素。(本部分有删减,招商银行各部请登录“招银智库”查看原文)

正文

前言:大模型发展背景下的银行业数字化转型

在存量竞争的时代背景下,当前银行业所面临的经营压力快速攀升。从资产端收益率持续下行到运营成本不断攀升,从日趋严格的监管政策到客户对个性化服务需求的激增,行业面临的挑战呈现多元化、复杂化特征。以消费金融领域为例,产品定价上限调整与获客成本上升的双重挤压正在显著压缩利润空间;业务运营场景中,自由格式报文的人工解析成本居高不下;在授信风控环节,传统人工处理企业尽调报告的模式已显现出效率瓶颈;而IT开发环节的代码生产与测试效率则难以全面满足金融科技迭代的需求。值得关注的是,随着算力革命和算法创新,大模型等人工智能技术正为银行业开辟全新的技术赋能路径,有望通过数字化转型显著提升资产组织效率并降低运营成本。

作为当下最受瞩目的技术突破,大模型凭借其在自然语言处理、知识库构建、代码生成等方面的卓越表现,正在银行业务全链条中加速渗透。从业务前台到技术后台,大模型的应用案例如雨后春笋般涌现:在客户服务领域, 部分银行的智能座席实践表明,大模型技术可实现客服通话时长压缩10%,人工成本降低80%,同时带来营销转化率的提升;支付业务中,某银行创新应用大模型处理跨境自由格式报文,实现了90%以上的分类准确率;在中台信贷分析环节,某银行“智能授信”项目将企业尽调报告撰写时间从1周缩短至5分钟,既优化了运营成本,还可能带来信贷模式的深远变革;在IT开发维度,多家银行通过部署智能代码助手,成功将代码生成率提升至20%-30%的水平。国际银行业的实践同样印证了大模型技术的应用价值。根据Evident最新研究数据,目前全球范围内55%的银行AI应用案例已开始引入大模型技术,这一趋势仍在持续强化。

相较于大模型等生成式AI的技术热度,判别式AI虽然讨论度相对较低,但在银行业现有业务架构中却默默发挥着关键作用。以逻辑回归和树模型为代表的判别式AI,在国内银行业的风控体系、智能放款以及7*24小时服务等场景中持续创造业务价值。这些技术凭借其运算效率、处理精度及结果可解释性等核心优势,恰好弥补了大模型在运算成本、结构化数据处理和可解释性等方面的局限。展望未来,银行业AI应用将呈现“生成式AI+判别式AI”的协同发展格局,通过伞形模式或串联模式实现技术体系的整体升级,构建更加完善的智能金融生态系统。观察全球金融领域的AI标杆企业摩根大通,不难发现其技术布局的均衡特征:一方面,对大模型的研究成果正快速攀升,包括模型性能测试、优化与场景探索等;另一方面,摩根大通对其他类型AI技术的投入始终保持稳定,利用AI模拟复杂经济系统、AI解释框架是两条尤为突出的主线。

从更高维度审视,对大模型等人工智能技术的应用目标是驱动银行的数字化转型。然而,数字化转型绝非简单的技术升级,金融业内外部的大量实践表明,业务流程的深度变革才是技术价值释放的关键路径。而成功的业务流程变革,必须建立在战略规划、组织协同和技术实施的闭环联动基础上,实现业务条线与科技条线的双向赋能。回望全球银行业过去五十余年的发展历程,我们清晰地观察到三次显著的技术变革浪潮,每次变革都伴随着业务流程的适应性调整。这种深层次的转型需要金融机构具备全方位的变革决心,包括:战略层面的顶层设计、长期投入的定力与耐心、跨部门协同的组织保障、变革节奏的科学把控。

基于上述洞察,本报告在整合国内外大型银行案例的基础上,采用层层递进的思路分析大模型发展过程中的三组重要关系:首先聚焦大模型技术在银行业的应用现状与前景,继而探讨生成式AI和判别式AI的协同机制与整合路径,最终延伸至企业级数字化转型的战略思考。基于这一系统性的分析路径,最终为银行业未来发展提出兼具前瞻性和实操性的业务思路,助力机构应对数字化转型过程中的不确定性,实现可持续增长。

图片
第一组关系:大模型的基础能力与银行的落地场景

目前大模型在银行业的落地场景呈现明显的“试验驱动”特征。这和其性能强大而工作机制尚未完全明确有关。在大模型之前,自然语言处理被视为计算机领域的难题之一,大模型的出现在三项性能上实现了重大突破:内容生成、信息提取、对话交互。这与银行业知识密集型的产业特征高度匹配,能为其海量文档的智能化管理提供有力支撑。然而,大模型属于典型的“发明先行、理论后置”的技术类别,与蒸汽机、遗传算法等历史发明相类似,这使得其能力边界尚不明确,具体应用效果有赖于实践过程的反复测试与调优。(类似观点可参见前微软中国研究院首席科学家张亚勤在南方科技大学iLEAP上的访谈交流)

从当前的实践来看,大模型的应用几乎覆盖了银行的全业务链条,前台服务和后台支持领域的应用最为广泛,中台运营的应用也在稳步推进。麦肯锡针对21个行业的研究显示,大模型约75%的经济价值集中在业务开发、运营优化、软件工程和产品研发领域,与银行业的具体实践基本吻合。

图1:国内银行业大模型应用建设情况**img

1.1 前台(业务开发):基于检索与问答的知识库与智能客服快速落地

在业务开发中,小微和零售信贷是金融科技应用的重要场景。目前金融机构在这些领域正面临着资产收益率下行与运营成本攀升的双重压力。以消费金融为例,主要消费金融公司的产品定价上限已普遍调整至24%以下,而获客成本与人力成本则在持续上升。大模型的发展为这类业务的优化转型提供了新的解决思路。

在获客与产品创新方面,现代金融业务越来越注重场景化产品设计,如汽车金融、电商供应链金融、家装分期及科创贷款等。这类产品的开发高度依赖垂直领域的专业知识积累,大模型强大的知识库构建能力恰好能有效优化这一痛点。以产品经理调研人工智能产业为例,传统信息检索流程包括关键词设计、文档筛选、内容预览和关键信息提取四个环节,学习过程类似“大海捞针”,耗时预计15个工作日以上。通过引入大模型,该流程被优化为“指令设计—AI生成—人工复核”的新模式,实现了从无差别检索到精准定位的转变,学习效率预计可提升80%以上。在产业实践中,目前Wind、DataYes等主流金融数据终端都已经将大模型做为搜索的前置入口,某股份行的信用卡系统实现了个性化营销文案的自动生成。此外,当银行内部数据被充分整合时,大模型还可以实现千人千面的营销功能,某国有行的技术实践推动了客户对理财产品的推荐满意度提升30%。

客服领域是大模型在知识库检索基础上,利用问答技术实现了触角的延伸。某国有行的远程助手实现了全流程智能陪伴,通话时长压缩10%;某互联网银行AI辅助座席对工单处理的准确率达90%,节省100人天工作量;某消费金融公司的智能客服系统实现营销效果提升30%、人工成本降低80%。根据IDC的预测,到2025年,超过80%的中国银行业机构都将部署数字人,承担90%的客服和理财咨询服务。

**图2:传统检索路径与大模型检索的文档待阅数量对比img

1.2 前台(跨境支付):某银行探索大模型处理跨境报文,降本效果突出

环球银行金融电信协会SWIFT在国际资金清算领域发挥着枢纽作用,但其系统中还存在着大量自由格式报文,传统的机器处理方法并不能直接解析,耗费大量的人工处理成本。以查询查复业务为例,MTn99是银行间常用的报文类型,除了关键信息以外,自由格式栏位中还囊括了大量冗杂信息。

由于贸易量增加、支付摩擦以及监管差异,近年来银行间的查询报文数量呈现上升趋势。2021年1笔跨境支付报文平均产生1.6笔查询报文,全年发送量为18.5亿笔。目前1笔跨境支付报文产生的查询报文已经超过2笔,2023年全年发送量增长至20.5亿笔,年均增速约5.2%。据测算全球每年用于查询的成本超过200亿美元,若缺少优化手段,相关支出可能进一步上升。随着NLP技术的深入发展,未来大模型有望在自由报文的处理上得到广泛的应用。近期某银行启动相关实验设计,基于2000多条报文样本的训练指出RNN、LSTM、BERT等模型在报文分类中的准确率可以超过90%,尤其BERT实现了高运算速度、高精确率和低损失率。随着数据样本增加,预计BERT模型的优势还将进一步显现。**

**图3:基于汇款的自由格式报文流转过程img
图4:全球支付报文与查询报文数量img

1.3 中台(信贷分析):某银行打造“智能授信”方案,企业资质分析为核心模块

“授信调查智能报告”是该银行大模型孵化实验室的标杆产品。该银行指出,大中型企业的授信报告篇幅约100页,传统撰写流程下耗时1周左右,大模型缩短至不到5分钟。截至5月中旬,这一方案已服务近2000名内部员工,覆盖29家一级分行。该银行利用大模型进行跨库信息处理,对企业指标的变化趋势进行比对分析,作为业务人员后续加工处理的基础依据。

对企业资质的总结是授信报告的核心。在企业主体层面,目前不少金融机构已和第三方供应商联合构建了涵盖工商、司法、企业公告的多维数据库,用于强化对于企业财务舞弊行为的识别。但这些数据库的构建效率仍然受到数据格式不统一、文本信息识别率不高的制约。以工商信息为例,传统Python技术对于人员和股权变更的识别率为80%,而接入大模型技术可提升至100%,并展现出对网络词汇、生僻字段的强适应能力。

尽管大模型对于企业资质的评估可能侧重于定性层面,但其技术发展对于银行信贷体系有可能带来更深远的影响。①事后审查转型实时审查:传统审查的分阶段执行模式存在滞后性,AI技术可以实现不间断分析;②抽样审查转变为全面审查:从有限的报表或政务信息扩展至更广泛的市场舆论监测,2024年某国有行专门申请了相关发明专利;③人力密集型审查转向算法密集型审查。

1.4 后台(IT开发):银行对大模型的另一主流应用

随着大模型技术的发展,目前市场已出现ChatGPT、AIxCoder、CodeGeex和GitHub Copilot等代码生成产品,这些技术可以显著缩短应用的开发周期并提升代码的质量和一致性,预计将对银行的金融科技发展形成巨大推力,获得国内多家银行的积极应用。

某银行搭建完善的方法论框架,计划在此基础上分阶段推进相关应用。①演进路径:借鉴自动驾驶技术分级理念,将智能代码助手的能力划分为L0到L5共6个等级;②技术评估:围绕金融行业对质量、安全等核心需求,进行技术准入、总体运行、代码检测和功能评估四维度评估;③应用工程:搭建一体化的研发辅助平台,通过实践积累高效提示词模板,实现编程任务的平台嵌入以及多语言、多IDE环境支持。内部试点数据显示,平台中AI生成的代码占比已达20%-30%,采纳率超过30%。未来该银行还将加速推动私域代码知识集成,预研AIGC驱动的低代码工程体系。

另一银行在系统研发测试场景落地六项功能,包括设计稿转代码、智能编码、智能单元测试、智能测试、智能研发安全、开发体验提升。在该银行的试点项目中,代码自动生成率达20%,单元测试行覆盖率60%-80%,测试制品采纳率31%。未来,该银行计划进一步构建覆盖业务需求、研发测试、用户体验、运行维护及数据分析全流程的科技大模型闭环。

1.5 国外银行业对于大模型的应用

国外银行业在大模型的应用结构方面与国内基本相同。根据第三方机构Evident的数据(统计周期:2024年3月至2025年3月,覆盖国家包括美国、英国、欧盟、新加坡、澳大利亚、加拿大、瑞士等),在全球银行业179个AI应用案例中,大模型相关案例数量99例,占比约55%。在应用场景分布上,知识库构建、运营支持、客户服务以及程序开发位居前列,为35例、17例、16例、14例,占比83%。

▶前台业务(如零售银行、投资银行业务):案例数量占比约55%,主要集中于机器人能力增强与运营中心支持,摩根大通、西班牙对外银行已成功将大模型技术整合至虚拟助理服务中;

▶中台业务(如风险授信、法律合规):案例数量占比约19%,正积极探索大模型在合同起草、KYC检查等环节的应用。典型案例为丹麦银行的Incident Detection x Dataminr项目——通过检索与分析超过100万个数据源,生成实时事件监测简报;

▶后台业务(如人力资源、信息技术):案例数量占比约26%,高度集中在利用大模型优化信息系统建设流程。多数案例以开发人员Copilot(AI助手)形式呈现。例如,澳洲联邦银行已实现员工通过自然语言方式查询并解决信息技术相关问题的功能。

从大模型服务的对象来看,当前国外案例主要服务于内部员工支持,占比约79%;直接面向客户的应用占比为21%。对内分布为主的格局主要是考虑到大模型在准确性方面的挑战以及政策监管环境的审慎要求。

图5:国外银行大模型应用的数量分布**
**

图6:国外银行大模型应用的典型案例img资料来源:Evident,招商银行研究院

img
第二组关系:大模型(生成式AI)与其他人工智能技术(判别式AI)

人工智能技术根据应用目的可分为生成式AI与判别式AI,大模型是生成式AI的代表,逻辑回归、决策树则是判别式AI的典型技术。长期以来,产业界对判别式AI进行了大量投资,但随着大模型技术的突破,市场上也出现了关于“生成式AI是否会完全取代判别式AI”的讨论。综合两类技术的优势,我们认为未来二者之间并非直接替代,更有可能是互补合作,类似人类的左右脑,优势互补将创造更显著的价值。

2.1 银行业前期在判别式AI领域形成大量投资

上一章中我们集中展示了大模型在银行业中的应用场景,这些场景主要应用了大模型在内容生成、数据提取、代码开发等方面的能力。然而,在信贷评分或者其他决策型业务上,大模型的直接参与较少。实际上,截至目前为止银行自动化决策模型的构建更多是使用以逻辑回归为基础的评分卡模型,或者以XGBoost和LightGBM为代表的树模型,这在信贷评估的贷前、贷中流程中都有广泛应用。相比之下,大模型或其他深度学习则主要是在贷后环节提供协助监测或逾期催收等。

图7:智能风控技术的应用场景及技术功能img

实际效果上,判别式AI对银行业务的智能化发展也形成了明显贡献,驱动了决策模式从专家经验、统计模型到人工智能的跨越式发展。例如,某国有行的风险预警系统识别准确率高,模型预警量相比原监督体系减少30%;另一国有行的风控体系在三大中心(模型管控中心、风险策略中心、风险计量中心)的基础上,开发了客户准入评价、信用风险评估、反欺诈、贷后风险监测等智能风控子模块,覆盖风险管理全流程;某股份行的智能放款功能覆盖了90%的放款量,单笔放款时长从5小时缩短为5分钟;另一股份银行在柜面渠道、电子渠道、自助渠道等全网络渠道引入7*24小时风控服务。

2.2 生成式AI参与决策面临三类挑战,与判别式AI合作可提升业务效果

从理论角度来说,AI的能力边界与模型参数规模正相关,因此市场上也在期待大模型的进化能促进其在决策型业务上的表现,从而降低金融机构技术架构的复杂程度或是减少模型之间的通信量。但这一目标的实现需要时间——波士顿咨询指出2030年以前金融机构对大模型的应用目标是实现流程的半自动化(理想情形是只需要在流程末端引入人类专家复核确认),而完全的端到端决策则需要更长的时间。我们认为,在大模型解决三类挑战之前,大模型与传统人工智能的互补合作将是金融机构AI部署的主流架构。

三大挑战

挑战一:模型参数并非越大越好,存在过拟合与算力资源的约束。过拟合是指模型在训练中表现优异,却在测试中“翻车”,丧失预测价值;庞大的算力消耗使得许多大参数模型不易落地。回顾人工智能发展史,小参数模型替代大参数模型的案例并不少见。20世纪60年代,全连接网络被应用于图像识别,但难以突破过拟合问题。直到1998年,CNN模型通过参数共享、池化操作进行简化才推动图像识别走向产业化。20世纪90年代,受限于算力条件,大参数模型无法落地,神经网络研究陷入低谷,风险资本撤离,顶级学术会议对相关主题文章“拒之门外”,SVM、CRF、LR回归等传统算法重回主导地位。2015年AlphaGO轰动全球,滤波器数量是架构设计的关键,Google团队经过对128、192、256等方案的反复测试,最终选定192作为最优参数。

挑战二:金融数据特性与大语言模型的优势领域存在错位。信贷决策的基础是借款人的多维度数据,涵盖人口统计特征(年龄、学历)、财务指标(收入变化)及行为数据(消费习惯)等。目前银行获取的这类数据存在两个显著特征。一是主要以结构化表格形式存在,与文本、图像等非结构化数据存在本质区别,这使得擅长处理非结构化数据的大模型在该场景下反而难以发挥优势;二是信贷领域普遍存在样本不平衡问题,即正常还款样本数量远超违约样本,这种数据分布特性给深度学习建模带来挑战,容易导致模型过拟合少数类或忽略关键样本。这意味着大模型优势的充分发挥,其前提是金融机构自身数据基础的完善。

挑战三:模型精度与可解释性。在国内外信贷风控领域,模型精度和可解释性是两大核心诉求,这一行业特性使得逻辑回归评分卡和树模型在决策任务中占据主导地位:前者能够直观展示各风险因素对评分的具体影响程度,后者则通过决策路径追踪和变量重要性评估提供透明的决策依据。相比之下,大模型目前的计算精度还存有欠缺,在信贷审批等高敏感场景中直接端到端使用可能带来不可控风险。同时,大模型的“黑盒”特性也与金融监管要求存在冲突,国内央行和金融监督管理总局对于银行算法都提出可解释性的要求,美国《平等信贷机会法》也规定信贷机构必须提供具体、可验证的拒贷理由。当模型无法清晰解释其决策逻辑时,将面临着客户投诉与监管部门的重点审查。

生成式AI与判别式AI的合作模式展望

结合生成式AI与判别式AI的原理和各自的优势,我们认为当前阶段二者的互补合作将是金融机构AI部署的主流架构。未来大模型和传统模型可能以两种模式展开合作。

伞形模式:大模型作为智能中枢负责将复杂业务目标拆解为标准化工作流,各环节调用判别式AI执行具体任务,大模型完成分析结果的整合与输出。以企业注销风险预警场景为例,工商注销不仅是企业经营的法律终止,也意味着未清偿贷款可能会转化为银行的不良贷款。判别式AI模型可用于执行风险预测,但传统的工作流存在明显瓶颈:在验证不同算法的适配性时,工程师需要手工完成从特征工程到模型验证的全流程,既产生大量重复劳动,又因个体经验差异导致评估结果波动较大。针对这一痛点,某银行利用大模型技术构建智能建模平台,通过自然语言交互界面实现“需求输入—自动建模—效果评估”的闭环流程,不仅将建模效率提升30%,更显著降低了人为因素对模型效果的干扰。

串联模式:指大模型与其他AI模型在同一层级协同工作,前驱模型的输出结果直接作为后续模型的输入数据。这种模式在最优解问题中展现出庞大潜力。传统AI计算器(如Fast-Downward)已被应用于航天、物流、旅游等产业,但对开发者要求严格,需同时具备领域专业知识和PDDL建模技能。大模型提供了新的思路,麻省理工学院的研究人员正探索两类新的方案:一是大模型独立计算,结合其逐步推理能力与外部反馈来优化输出序列;二是混合方案,大模型将用户需求解析为传统AI计算器可处理的数据结构,再由其求解。实验结果凸显了混合架构的稳健性——在100条旅游线路任务中,混合方案在79%的情况下所产生的效用高于GPT-4独立计算。事实上,若考虑时间等约束条件,大模型独立计算的有效性将降至20%以下,当可选景点增加时,有效性还将持续下降。同时,我们也关注到目前部分研究正探讨在银行风控决策中对大模型中的Transformer架构和判别式AI进行融合,来提升风险识别效果 ,这类研究值得长期跟进。

2.3 全球标杆案例之摩根大通:理论研究扎实,各类AI技术均衡布局

摩根大通是全球金融业的AI标杆,2018年成立人工智能实验室(以下简称“AIR”),由美国工程院院士Manual Veloso担任负责人。2024年数据显示,摩根大通科技投入高达170亿美元,占其总营收的10%,配备了2700名专注于人工智能、机器学习等领域的专业团队。摩根大通的科研成果为我们观察金融巨头的AI前沿提供了绝佳样本。从AIR在2021—2025年5月的167项科研成果来看,目前摩根大通对大模型的研究力度明显上升,对于其他的人工智能技术也长期保持着积极关注。

大模型研究数量井喷。2021年—2025年5月AIR在大模型方面的研究数量分别为2、5、9、30、9项,主要围绕三大方向展开。①性能评估:AIR高度关注大模型与金融的适配性,其对于模型的认知并非直接采用第三方测评结果,而是基于CFA考试表现、股票评级能力、时间序列识别等维度开展评估,并构建数值推理、反欺诈检测等验证数据集。这类研究共17项,占比30%,反映摩根大通在探索大模型能力边界时的稳健态度。②性能优化:相关研究共18项,聚焦RAG、智能体Agent、金融表格数据处理能力、大模型轻量化等方向;③场景应用:相关研究共15项,其中程序开发与文档分类占11项,在COIN法律文档系统和美联储讲话分析场景中得到应用。

其他人工智能领域保持平稳投入。2022—2024年期间,摩根大通每年在该领域研究的项目数量稳定在20-40项之间,利用AI模拟复杂经济系统、AI的解释框架是两条研究主线。前者累计产出20项,并建立了支持超万级交易主体的模拟平台,为摩根大通提供了高保真度的市场动态观测窗口;后者累计产出17项,包括特征重要性分析与反事实解释等理论研究。**

**图8:摩根大通AIR研究成果数量img

图9:摩根大通AIR主要研究路线解析img

img
第三组关系:人工智能与银行的数字化转型

3.1 银行对大模型的投资有可能形成两极分化的格局

金融机构在部署大模型等AI技术时面临显著的前期投资压力。以建设智算集群为例,通常需要配置500台以上的服务器,按照单台服务器200万元的成本计算,仅硬件投入就高达10亿元以上。这一数字对单个银行而言不容小觑——以2024年数据为例,20家披露科技投入的银行平均支出为96亿元,这意味着大模型硬件投资可能占到银行科技总投入的10%以上。庞大的前期投入使得市场高度关注大模型的实际经济效益,而目前业界对此的看法存在明显分歧。

**图10:上市银行2024年的信息科技投入img

▶从行业和企业层面来看,不同机构的研究结果呈现出较大差异。信托网研究院的调研显示,DeepSeek将大模型训练成本降至行业平均水平的1/5以下,推理成本降幅更是超过90%,预计2025年AI技术可为信托行业带来20%-30%的运营成本优化。波士顿咨询对某国际银行的评估指出,大模型的规模化应用有望给该银行节省1.5亿美元人工成本,占总薪酬包的7.5%,其中IT、销售和运营部门合计降本1.2亿美元。然而,也有银行从业者持保留态度,指出当前大模型在金融核心业务中的适配性仍有不足,使用率偏低;更值得注意的是,大模型的“幻觉”问题还可能使得员工的工作量不升反降。

▶在场景层面,大模型的表现同样存在分化。在信贷审批中,某国有行审批人员反馈,大模型能基于标准化模板快速提取信息生成初始报告,显著减少了前期的“填表”工作;但另一银行的个贷经理则指出AI系统的授信额度往往过于保守,通常需要人工进行二次测算。在智能客服领域,大模型的投入产出比与直销客户规模和应用场景数量成正比,某信托公司副总经理对于智能系统的部署持谨慎态度。

实际上,大模型本质上是企业数字化转型的工具抓手,而企业的数字化转型本身就存在着两极分化现象。麦肯锡全球调研数据显示,企业数字化转型成功率仅为16%,失败率高达84%。以电商行业为例,头部企业数字化成效显著:阿里、美团、拼多多等企业推动国内网上零售额从2015年的3.88万亿元跃升至2024年的15.52万亿元,而同期线下企业的新零售转型却屡屡受挫。在银行业这一现象也成立,数字化领先的股东回报年增长率达8.2%,显著高于落后者的4.9%。

图11:数字化转型两极分化现象img

3.2 银行历次重大的数字化创新实际上是业务流程的同步变革

为什么有些企业数字化转型成功,而有些却失败?我们认为关键在于数字技术与业务的融合深度。许多企业误以为数字化就是比拼设备和系统性能,却忽视了技术与业务的深度融合,导致投入大、见效小。麦肯锡对全球80家银行的研究发现,在移动应用渗透率等基础指标上,落后银行能快速跟进领先者,差距保持稳定。这是因为移动应用等技术产品容易被模仿,一家银行推出新功能后,其他银行通常在6-12个月内就能复制,难以形成持续优势。但在数字化渠道销售额、分支机构人员配置等进阶指标上,差距却显著拉大。例如过去5年间,领先银行的数字化渠道销售额增长30%,而落后银行仅增长9%。这种差异源于深层次的业务流程变革——领先企业通过数字化重构业务模式,而落后企业仅停留在技术应用层面。

图12:银行业数字化转型的核心指标img

以上对比说明只有将数字化深度嵌入业务流程,才能产生持续竞争优势。回顾过去50年银行业的3次技术飞跃,金融电子化、互联网金融与FinTech,我们也可以观察到每一次成功应用背后都是业务的同步变革。

金融电子化阶段(约1967—2008年):核心特征在于金融服务流程的电子化改造与效率提升,最具代表性的技术创新包括ATM机的普及应用,以及随后发展起来的核心交易系统、信贷管理系统和跨境支付系统等重要金融基础设施。在此之前,银行业务呈现出明显的分散化特征。各分支机构独立运营,客户账户信息和交易记录仅保存在开户分行,跨行交易往往需要数日时间才能完成清算对账。电子化带来了显著的变化:一、银行将大量后台操作岗位从分支机构剥离,集中到新成立的区域或总行运营中心进行标准化批量处理,分支机构逐渐转型于业务营销和前台服务。二、数据集中处理模式下,银行总部得以实时掌握全行业务状况、资金头寸和风险敞口,为基于系统数据的KPI考核等现代化管理手段的推行奠定了基础。

互联网金融阶段(约1994—2017年):随着互联网技术的快速普及,银行业率先推出在线银行、电子支付等创新服务,2007年iPhone的问世和智能手机的快速普及,则进一步加速了移动金融的发展。这一阶段的创新成果包括网上银行、互联网理财、P2P网贷以及移动支付技术。其中移动支付技术最具标杆意义,第三方支付公司通过便捷的银行账户绑定、实名认证流程和支付密码机制,优化了传统银行卡的在线交易验证模式,引发合作银行对其网关支付接口、交易处理系统、资金清算流程和后台风控体系进行深度改造。中国人民银行在2005—2010年相继推出的大额实时支付HVPS、小额批量支付BEPS、网上支付跨行清算IBPS、境内外币支付FCPS等系统则是我国金融支付体系为适应科技潮流做出的宏观架构变革。

FinTech阶段(约2015年至今):人工智能、区块链、云计算和大数据等前沿技术加速推动了金融的普惠化发展。数据融资是本轮金融科技所产生的重大业务创新,其成功落地同样有赖于银行业务架构的变革推动。我们以某银行的普惠金融业务为例,2024年末该行普惠贷款余额已超过1万亿元。尽管全行共享新一代核心系统、小微企业评分卡及风险预警平台等技术设施,但基层的业务仍然出现明显分化。以其某家分行为例,前5家支行贡献55%业务量,后8家仅45%。领先与落后支行的对比经验充分彰显业务流程变革的重要性。一是基层的考核激励差异:分值最高超17分、最低不足5分,费用配置最高80万元、最低10万元,直接影响业务开展成效;二是尽职免责的制度规定在一线中执行困难,某支行2022年受罚后,业务长期停滞。未来,随着大模型等AI技术的深入应用,我们预计银行的业务流程还将继续调整,在前文中台(信贷分析)案例中,大模型的应用有可能驱动信贷体系从事后审查转型实时审查,从抽样审查转变为全面审查,从人力密集转向算法密集,就是一种深层次影响。

3.3建立适配数字化转型的组织体系有助于推动流程变革

业务流程变革并非易事,主要面临部门协作、收益分配、伙伴意愿、数据基础四个方面的挑战。①部门协作:高级数字化项目虽能带来更大经济效益,但其复杂的跨部门协作也面临挑战。企业级项目需要营销、运营、开发等部门密切配合,而资源争夺或责任推诿等问题都可能延误甚至中断项目进程。②收益分配:业务重组改变了资源分配方式,部分岗位被整合引发员工抵触。某制造企业在引入自动化产线后,因工时减少将工人薪资下调25%,导致工人抵制并违规操作设备,使产量下降。企业不得不暂缓自动化投产,通过增派人手完成紧急订单。③伙伴意愿:某知名消费品牌推行渠道数字化时遭遇阻力。内部员工因不习惯新职责,销售人员离职率达20%;部分优质经销商也因不理解新模式而终止合作。新旧模式交替导致人才和渠道资源流失。④数据基础:数据资产是数字系统的核心,但梳理难度大。一是需要平衡数据量与效率,数据不足影响决策,过多则浪费资源;二是企业内部常存在数据孤岛,指标口径不一,增加了整合难度。

单一环节入手通常难以解决上述痛点,这有赖于企业层面的全局性安排。某银行2020年线上供应链融资试点提供了有意义的借鉴方案。该行早在2011年就设立了供应链金融部门,但到2020年业务规模仅200亿元,因成本高、规模小面临发展困境。2020年,该行率先试点线上经销商融资业务,技术层面实现产互平台的ERP系统对接与政务数据的整合,但在推进中遇到三大难题:经营团队因投入产出比低不愿做、怕担责不敢做、缺乏指导不会做。为此,该行成立由行领导牵头、4个条线8个部门组成的工作小组,取得三项突破:一是打通对公零售数据,整合企业主信用记录、资产信息等,建立以交易数据为核心的自动化审批流程;二是出台激励政策,包括5000万元不良容忍额度、KPI加分和专项费用支持;三是强化总行统筹,将合同审查等核心环节上收总行集中运营,建立总分行联动的贷后管理模式(总行模型监控、分支排查预警)。这些举措为业务转型奠定了基础。综观国内各类产业的数字化转型案例,成功企业通常在战略高度、投资定力、协作安排、节奏控制四方面已提前做好安排。

**图13:国内不同产业的数字化转型经验img

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值