数据科学与 SQL 的实践与展望
1. 预测模型创建回顾
预测模型的创建是一个迭代的过程。在最初探索数据之后,还需要在数据转换后多次进行探索,以寻找更好的修正方法,使数据更适合预测模型。
- 数据探索技术 :
- 可以使用 T - SQL 查询、SSIS 数据探查任务和 R 脚本等技术来探索源数据的物理结构,揭示其隐藏模式。
- 对于基本的数据探索,如查看描述性统计、值的唯一性以及列中的 NULL 数量,T - SQL 查询或 SSIS 数据探查任务非常有用;对于更复杂的探索,可能会使用 R 或 Python 等语言。
- 数据转换 :进行了多次 T - SQL 转换,并再次探索数据,以确保转换不会损坏数据。
- 存储过程开发 :开发了训练存储过程,并对模型质量进行评估。同时,创建了用于定期训练预测模型的存储过程,以及用于进行预测的存储过程。
下面以一个实际例子来说明,之前执行的存储过程计算了一个小村庄的私人客户语音通话所花费的分钟数估计。结果显示,预测小村庄的客户外拨文本通话最多为一分钟。
2. 常见问题解答
| 问题 | 解答 |
|---|---|
| 哪些 SQL Server 版本和版本有机器学习服务? | 从 2016 版开始,SQL Server 提供机器学习服务(以前称为 R 服务),并且可以在每个版本的 SQL |
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



