VLDB summer school(一)近似查询处理1——概括

本文是VLDB Summer School 2017的笔记分享,主要介绍了近似查询处理(AQP)的基本概念、数学基础、采样预测、数据库抽样、Bootstrap和Sketching等方法,探讨了在大数据背景下,如何通过近似技术提高查询效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

VLDB summer school(一)近似查询处理1

有幸参加VLDB Summer School 2017,7天数据相关课程,收获良多,将知识记录并与大家分享。

一、近似查询处理(AQP)概括介绍

为什么研究AQP?
1. 数据集变得越来越大
2. 并不是所有查询都在乎高精度
3. 可参考研究成果易获得
4. 如果数据量变得庞大,精确查询花费将变得巨大

Let’s sample:

• A 1TB relation sale (sid, serialnum, price)
• A 50GB relation part (serialnum, partid, cost)
• A 5MB relation partinfo (partid, category)

image

But sampling not the only option for AQP.
Five types of methods in the literature :

1、 Histograms(直方图)

基本思想:
- 将数据分入不同的组
- 汇总每一个组

Example:
ages are {21,22,24,45,47,49

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值