理解SQL中的DISTINCT查询 - interactive-tutorials项目解析
什么是DISTINCT查询
在SQL中,DISTINCT
是一个强大的关键字,它允许我们从数据库表中获取唯一不重复的值。当我们需要统计表中或分组行中的唯一值数量时,DISTINCT
就显得尤为重要。
DISTINCT的基本用法
DISTINCT
指令会返回一个去重后的结果集。如果两行或多行在所有选定列上的值完全相同,那么DISTINCT
将只保留其中一行。
实际应用场景
假设我们有一个学生成绩表,包含学生姓名、科目和分数。我们可能需要:
- 获取所有学生的名单(不重复)
- 统计有多少不同的学生在表中
- 列出所有开设的科目
示例分析
让我们通过一个具体的例子来理解DISTINCT
的用法:
CREATE TABLE grades (name TEXT, subject TEXT, grade INTEGER);
INSERT INTO grades (name, subject, grade) VALUES
("John", "CompSci", 97), ("Eric", "CompSci", 88), ("Carol", "Arts", 99),
("John", "History", 93), ("Andrew", "History", 82), ("Eric", "History", 87),
("Steve", "Physics", 91), ("John", "Physics", 84), ("Barney", "Physics", 97);
-- 统计所有姓名记录数(包含重复)
SELECT "all names", COUNT(name) FROM grades;
-- 统计唯一姓名数量
SELECT "unique names", COUNT(DISTINCT name) FROM grades;
-- 获取所有不重复的学生姓名
SELECT DISTINCT name FROM grades;
DISTINCT与GROUP BY的比较
DISTINCT
查询在功能上类似于在所有选定列上使用GROUP BY
子句。两者都会将完全相同的行分组在一起。但它们有以下关键区别:
- 功能差异:使用
GROUP BY
可以计算每个分组中的行数(通过聚合函数),而DISTINCT
则不能 - 性能差异:在大多数情况下,
DISTINCT
比等效的GROUP BY
查询更高效 - 可读性:当只需要去重而不需要聚合计算时,
DISTINCT
语法更加简洁明了
实践练习
让我们完成一个实际练习:从成绩表中获取所有不同的科目列表。
解决方案
SELECT DISTINCT subject FROM grades;
执行这个查询将返回:
CompSci
Arts
History
Physics
高级用法提示
- 多列去重:可以对多个列使用
DISTINCT
,如SELECT DISTINCT name, subject FROM grades;
- 与ORDER BY结合:可以在
DISTINCT
查询后添加ORDER BY
子句对结果排序 - 性能考虑:在大表上使用
DISTINCT
可能会影响性能,因为它需要对所有选定列进行比较
总结
DISTINCT
是SQL中一个简单但功能强大的关键字,它能帮助我们快速获取数据中的唯一值。理解并掌握DISTINCT
的使用方法,将使你的数据查询更加高效和精确。在实际应用中,根据具体需求选择DISTINCT
或GROUP BY
,可以编写出更优化的SQL查询语句。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考