天气指标数据筛选实战

本文介绍了如何使用Python对接ES进行天气指标数据的高效筛选和导出。通过理解查询优化,包括分区查询和减少不必要的数据传输,以北京天气为例,展示如何配置DSL并使用value_count统计准确数据量,最终将数据转换为CSV文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

上节课中介绍了对天气指标数据的采集生成,这节课中将重点介绍如何使用 Python 对 ES 开发,以天气指标数据为例。Kibana 确实也能够提供丰富的功能对天气指标数据分析,但是我们的需求是要得到分析原始结果,Kibana 分析的结果需要登录在线看,不能够被缓存下来。

天气 App

假设一个项目场景,开发一款手机天气 App,这款 App 数据由 ES 进行管理。

假设公司在开发一个 15 天趋势预报功能,如下图,想要得到预测数据,那就得使用深度学习去训练不同地区的天气历史数据,大家都是知道深度学习非常的吃数据,因此数据当然是越多越丰富越好。而你在的部门专门有个程序负责采集每天的天气状态,然后存到 ES。你老大布置给你个任务,由你来负责把不同地区的天气历史数据,采集下来,然后用来训练模型。

image-20200411143725125

数据采集

拿到这样的需求,先分析一波。

不同地区的话,那就是要根据地区进行筛选,配置个 filter 就行了,之前的课时也讲过,这种需求应该配置 filter 而不是用 must 来配置条件,这里回顾一下,如果使用 filter 来作为

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值