AI信息架构:从机器学习工作流到云部署与可信基础
1. AI信息架构与机器学习工作流
AI信息架构与机器学习(ML)工作流紧密相关。在ML工作流中,有几个关键能力尤为重要:
- 模型可移植性 :能够在任何地方开发并部署模型,实现跨平台的透明性。
- 模型监控 :通过推理反馈来了解模型性能的退化情况。
- 模型准确性 :对模型进行再训练,以适应变化并保证准确性。
ML工作流始于对源数据和历史数据的访问与摄取。根据不同的用例和数据源,这需要多种能力,如数据连接器(例如使用JDBC)、数据虚拟化等。传感器或语音数据也可能用于后续步骤,如ML或深度学习(DL)模型的开发和训练。
数据准备和质量改进阶段通常是整个ML工作流中最密集和耗时的步骤,可能会消耗超过80%的精力和总时间。数据整理(Data wrangling或munging)结合数据转换、聚合、质量改进、过滤和整理等操作,确保源数据(包括传感器、语音、文本或图像数据)是可信、完整、可消费且适合AI使用的。
ML和DL模型的训练、验证和测试是模型开发过程中的常见步骤。
在大多数业务场景中,模型的部署和运营,以及ML和DL模型的推理和评分是真正的挑战。这是因为在模型开发阶段,使用了多种数据源来确定合适的预测因子和特征。部署后,推理和评分应用依赖于以“正确”格式及时提供新数据。这个过程需要一个全面且灵活的AI信息架构,包括供应、推理和模型评分等能力块(ABBs)。
ML和DL模型的准确性和精度可能会随时间下降,因此需要对其进行监控。对于
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



