11、PyExplore 2.0：基于可解释、近似和组合聚类的 SQL 查询推荐-优快云博客

本文链接：https://blog.youkuaiyun.com/c7d8e9/article/details/150632112

PyExplore 2.0：基于可解释、近似和组合聚类的 SQL 查询推荐

1. 引言

随着数据量的增长、数据复杂性的提高以及用户对数据库内容的不熟悉，数据查询变得既复杂又耗时。用户在与数据集交互时，常常不清楚该提出什么样的查询。为解决这一问题，我们致力于设计一个不依赖查询日志的 SQL 查询推荐系统，提供直观且可解释的推荐，并通过近似推荐减少执行时间。

我们选择扩展 PyExplore，它是一个先进的 SQL 查询推荐框架，无需查询日志。用户提供初始 SQL 查询后，PyExplore 会生成带有增强 WHERE 子句的新 SQL 查询推荐。我们扩展了 PyExplore，新增了四种工作流，分别用于近似查询推荐、可解释查询补全、组合可解释和近似推荐，以及采样决策树工作流。

我们的贡献包括：
- 基于 PyExplore 提供四种新的工作流，以创建可解释和近似的查询推荐。
- 在三个开放数据集上进行全面评估，确定四种工作流生成的推荐质量、执行时间以及与完整工作流相比的加速效果。