6、利用统计指标的数学结构与共享分布式数据集方法优化查询性能

利用统计指标的数学结构与共享分布式数据集方法优化查询性能

在当今大数据时代,数据量呈爆炸式增长,对数据的处理和分析需求也日益增加。本文将介绍两个重要的研究内容,一是利用统计指标的数学结构进行模式级比较,二是提出共享分布式数据集(S2D)方法来优化分布式数据仓库中的多查询执行性能。

利用统计指标的数学结构

考虑两个库CityA和CityB,通过推导所有指标,推理器可以推断出可计算指标的完整集合。
- 指标集合推导
- IA = {kpi:TotalEmission, kpi:TotEmissionPerCapita, kpi:TotalPopulation}
- IB = {kpi:TotalEmission2, kpi:NOXEmission, kpi:SOXEmission, kpi:PM10 Emission, kpi:TotalPopulation, kpi:NH3Emission, kpi:TotalEmission, kpi:Tot EmissionPerCapita}
- IA中的第三个指标是从TotEmissionsPerCapita公式推导得出的。对于IB,NH3Emission指标是从TotalEmission2公式推导得出的,前提是其他操作数可用,而TotalEmission是从TotalEmission2和PM10Emission计算得出的,TotEmissionsPerCapita则是从TotalEmission和TotalPopulation计算得出的。
- 两个库共享的指标集合为IA ∩ IB = {kpi:TotalEmission, kpi:TotEmissionPerCapita

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值