数据转换与预测模型实践
在数据科学领域,数据转换和预测模型是两个至关重要的环节。数据转换能够将原始数据处理成适合分析和建模的形式,而预测模型则可以基于处理后的数据进行预测和决策。本文将介绍使用 Azure Data Factory 进行数据转换,以及如何为 SQL Server 配置机器学习服务以进行预测模型训练和评估。
1. Azure Data Factory 简介
Azure Data Factory(ADF)可以被看作是基于云的 SSIS,但它的技术背景和术语与 SSIS 有所不同。ADF 有 v1 和 v2 两个版本,当前的 v2 版本提供了集成运行时,使得可以将托管在 Azure 环境中的本地 SSIS 包作为活动的一部分使用。
ADF 使用以下核心术语:
- Linked service :数据存储定义,例如 SQL Server 数据库(包括本地实例)和 Hadoop 等。
- Dataset :从 Linked Services 获得的值矩阵。
- Activity :对数据集执行一个任务,处理后生成新的转换数据集。
- Pipeline :ETL 管理单元,用于安排重复的数据转换任务、监控和诊断任务。
2. 创建 Azure Data Factory
要创建 ADF,首先需要一个 Azure 订阅。可以按照以下步骤创建 ADF:
1. 登录到 Azure 门户(https://portal.azure.com)。
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



