特征工程与模型训练基础设施解析
在机器学习(ML)的开发过程中,特征工程和模型训练是两个至关重要的阶段,它们需要强大的基础设施支持,以确保高效、准确地完成任务。下面将详细介绍特征工程基础设施中的开源解决方案 Feathr 和商业供应商解决方案 Tecton 特征平台,以及模型训练基础设施的相关内容。
1. Feathr 特征存储解决方案
Feathr 主要由 LinkedIn 开发,并在 2022 年成为开源项目。尽管它对 Azure 有一定的偏向性,但在灵活性方面,它能支持大多数常见的数据源、离线存储和在线存储。
| 数据来源 | 离线存储 | 在线存储 |
|---|---|---|
| Snowflake、Azure SQL DB、Azure SQL、AWS S3、Delta Lake | Snowflake、Azure SQL DB、Azure SQL、AWS S3、Azure Blob Storage、Azure ADLS Gen2、MySQL、SQL Server | Redis、Azure Cosmos DB |
1.1 Feathr 的优势
- 全面的特征存储解决方案 :具备特征定义、特征注册表、用户界面(UI)和软件开发工具包(SDK),支持特征生成、特征服务以及离线和在线支持。
超级会员免费看
订阅专栏 解锁全文
4648

被折叠的 条评论
为什么被折叠?



