航班数据可视化与实时流处理
1. 数据可视化与决策模型
1.1 数据源选择
在数据可视化工具中,不同的数据源有不同的支持方式。例如,Data Studio 支持将 BigQuery 查询作为数据源,而 Cloud SQL 仅支持将表(或视图)作为数据源。并且,即使连接器支持从查询中读取数据,从视图读取也是更优选择,因为视图具有更高的可重用性。
1.2 航班数据可视化
通过构建包含饼图和条形图的仪表盘,我们可以直观地看到航班的准时情况。平均而言,约 80% 的航班能够准时到达,不同航空公司的典型到达延误时间在 0 到 15 分钟之间。
1.3 决策模型构建
为了更好地为用户提供决策依据,我们构建了一个简单的模型:当航班的出发延误超过 10 分钟时,建议商务旅行者取消即将安排的会议,这样他们有 70% 的机会能提前 15 分钟参加会议。为了展示这个模型,我们需要对仪表盘进行改进,展示不同出发延误阈值(10、15 和 20 分钟)下的航班情况。
1.4 视图创建
在 Cloud SQL 中,我们可以创建所需的视图来作为仪表盘的数据源。具体代码如下:
CREATE VIEW delayed_10 AS SELECT * FROM flights WHERE dep_delay > 10;
CREATE VIEW delayed_15 AS SELECT * FROM flights WHERE dep_delay > 15;
CREATE VIEW delayed_20 AS SELEC
超级会员免费看
订阅专栏 解锁全文
53

被折叠的 条评论
为什么被折叠?



