Python微信订餐小程序课程视频
https://blog.youkuaiyun.com/m0_56069948/article/details/122285951
Python实战量化交易理财系统
https://blog.youkuaiyun.com/m0_56069948/article/details/122285941
Fauce:Fast and Accurate Deep Ensembles with Uncertainty for Cardinality Estimation 论文解读(VLDB 2021)
- 本篇博客是对Fauce:Fast and Accurate Deep Ensembles with Uncertainty for Cardinality Estimation 论文的解读。原文链接为p1950-liu.pdf (vldb.org)
- 本文设计一种基于集成深度神经网络的基于查询的选择度估计器,文章的主要贡献有:
- 第一次设计实现了一种可以反映估计结果的不确定性的技术估计器。
- 介绍了一种新的查询特征化的方法,利用了数据库的连接模式捕获表列间的真是相关性。
- 在数学上定义了估计不确定性的含义,并通过设计实现集成深度神经网络实现了对估计结果的不确定性的评估。
- 通过不确定性管理模块可以通过增量学习进一步提高模型的准确性。
转化为回归问题
因为查询的基数均为实数,因此我们可以建立一个回归模型MMM。对于任意范围的查询语句,模型MMM可以产生匹配或接近实际基数值的回归结果。
模型MMM作为一个回归模型,其输入应为一个实值向量。因此我们必须将给定的查询语句转化为一个对应的实值向量,这个过程称为查询特征化。本文的查询特征化方法将在后文介绍。总之MMM将特征化向量作为模型的输入,实际的基数值作为标签进行训练以期望产生一个可以很好拟合query-cardinality映射关系的函数。
查询特征化
在训练M

本文详细解读了Fauce论文,它提出了一种快速准确的深度集成神经网络,用于基数估计并量化不确定性。通过转化为回归问题、查询特征化、训练数据处理和不确定性量化等步骤,Fauce设计了一种能够反映估计结果不确定性的技术。论文重点介绍了如何利用图嵌入方法对表、连接和列进行编码,并通过深度神经网络集合来提高基数估计的准确性。最后,通过不确定性管理来评估和改进模型的可靠性。
最低0.47元/天 解锁文章
2984

被折叠的 条评论
为什么被折叠?



