12、航班数据处理与事件流模拟:从本地到云端的全流程实践

航班数据流处理与云模拟

航班数据处理与事件流模拟:从本地到云端的全流程实践

1. 运行初始代码

可以通过命令行运行位于 04_streaming/simulate/df01.py 的 Python 程序。具体操作步骤如下:
1. 安装 Cloud Dataflow 包(Cloud Dataflow 是 Apache Beam 的执行环境)。
2. 进入包含代码仓库的目录,执行以下命令:

cd 04_streaming/simulate
./install_packages.sh
python ./df01.py

运行上述代码后,会在 Google Cloud Platform 上使用 Cloud Dataflow 服务运行 df01.py 中的代码,将数据管道部署到云端的多个工作节点上。输出文件的名称以 “extracted_airports” 开头,例如 “extracted_airports-00000-of-00014”,文件内容示例如下:

1000101,58.10944444,-152.90666667
1000301,65.54805556,-161.07166667

这些列分别代表 AIRPORT_SEQ_ID、LATITUDE、LONGITUDE,行的顺序取决于哪个并行工作节点先完成,因此可能会有所不同。

2. 添加时区信息

为了确定经纬度对应的时区,对代码进行修改。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值