AI模型构建:基础模型与窄机器学习模型的选择与实践
1 基础模型与窄机器学习模型的选择考量
在设计基于机器学习的应用时,首要决策之一便是选择窄机器学习模型还是基础模型(FMs)。当前多数AI系统由窄机器学习模型和非AI组件构成,二者在系统架构中共存并相互协作,以确保系统正常运行。窄机器学习模型负责特定任务的推理,非AI组件则处理数据存储、与其他系统的交互、用户界面、基于规则的逻辑等功能。
1.1 选择决策的关键因素
选择窄机器学习模型还是基础模型,主要取决于成本和数据可用性,或者投入精力使数据可用的意愿。成本是决策的关键因素,主要包括以下几个方面:
- 工具成本 :若组织构建多个窄机器学习应用,可能会使用相同工具管理数据准备和模型构建,工具成本可分摊到多个应用中,可视为单个应用的运营成本。
- 开发成本 :非AI组件的开发成本大致相当。若组织选择训练或微调内部基础模型,开发成本将分摊到多个应用中,单个应用的相关成本为运营成本。训练最先进的大语言模型(LLMs)估计需数千万美元,但特定领域的定制基础模型训练成本可能低很多。数据摄入成本和模型定制成本是开发成本的主要组成部分,具体差异取决于应用的数据情况。
- 维护成本 :窄机器学习模型和基础模型在维护成本上差异相对较小,非AI组件的演进成本相似,训练数据的演进或输入数据的清理成本取决于数据的具体情况。
- 运营成本 :窄机器学习模型在运营成本上具有明显优势。窄机器学习模型可在本地资源上托管,无需使用云服务;即便在云端托管,也仅需支付使用的资
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



