亚马逊 Redshift 机器学习与数据共享全解析
1. 亚马逊 Redshift 机器学习基础
1.1 模型预测示例
在竞赛场景中,我们可以通过以下 SQL 查询获取相关数据:
human_speed)
FROM
race.speed_inference
LIMIT 5;
同时,给出了人类赢得比赛的概率预测结果:
| probabilities | labels |
| — | — |
| [0.98792028, 0.01207972] | [“f”, “t”] |
| [0.99937975, 0.00062025] | [“f”, “t”] |
| [0.91194165, 0.08805832] | [“t”, “f”] |
| [0.95782197, 0.04217804] | [“t”, “f”] |
| [0.93414819, 0.06585180] | [“t”, “f”] |
从这些数据可以看出,前两行输入数据中人类赢得比赛的概率较低,而后三行较高。
1.2 模型解释
在机器学习中,用作模型输入的每个独立变量称为特征。在 Amazon Redshift ML 中,用于构建模型的列就是该模型的特征。
使用 explain_model 命令可以获取 ML 模型的可解释性报告,该报告包含所有模型特征的 Shapley 值信息。Shapley 值有助于理解每个特征对模型预测的贡献
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



