数据库知识点总结(二)
SQL
一、基础
模式定义了数据如何存储、存储什么样的数据以及数据如何分解等信息,数据库和表都有模式。
主键的值不允许修改,也不允许复用(不能将已经删除的主键值赋给新数据行的主键)。
SQL(Structured Query Language)语句不区分大小写,但是数据库表名、列名和值是否区分依赖于具体的 DBMS(Data Base Management System 数据库管理系统) 以及配置。、
SQL 支持以下三种注释:
#注释
SELECT *
FROM mytable; – 注释
/* 注释1
注释2 */
数据库创建与使用:
CREATE DATABASE test;
USE test;
二、创建表
CREATE TABLE mytable (
#int 类型,不为空,自增
id INT NOT NULL AUTO_INCREMENT,
#int 类型,不可为空,默认值为 1,不为空
col1 INT NOT NULL DEFAULT 1,
#变长字符串类型,最长为 45 个字符,可以为空
col2 VARCHAR(45) NULL,
#日期类型,可为空
col3 DATE NULL,
#设置主键为 id
PRIMARY KEY (‘id’));
三、修改表 – 列操作
1. 添加列
ALTER TABLE mytable
ADD col CHAR(20);
2. 删除列
ALTER TABLE mytable
DROP COLUMN col;
3. 删除表
DROP TABLE mytable;
四、插入
1. 普通插入
INSERT INTO mytable(col1, col2)
VALUES(val1, val2);
2. 插入检索出来的数据
INSERT INTO mytable1(col1, col2)
SELECT col1, col2
FROM mytable2;
3. 将一个表的内容插入到一个新表
CREATE TABLE newtable AS
SELECT * FROM mytable;
五、更新
语法: UPDATE 表名称 SET 列名称 = 新值 WHERE 列名称 = 某值
UPDATE mytable
SET col = val
WHERE id = 1;
六、删除
DELETE FROM mytable
WHERE id = 1;
TRUNCATE TABLE可以清空表,也就是删除所有行。
TRUNCATE TABLE mytable;
使用更新和删除操作时一定要用 WHERE 子句,不然会把整张表的数据都破坏。可以先用 SELECT 语句进行测试,防
止错误删除。
七、查询
1. DISTINCT
列中重复的相同值只会出现一次。它作用于所有列,也就是说所有列的值都相同才算相同。
语法:SELECT DISTINCT 列名称 FROM 表名称
SELECT DISTINCT col1, col2
FROM mytable;
2. LIMIT
限制返回的行数。可以有两个参数,第一个参数为起始行,从 0 开始;第二个参数为返回的总行数。
返回前 5 行
SELECT *
FROM mytable
LIMIT 5;
SELECT *
FROM mytable
LIMIT 0, 5;
返回第3- 5 行
SELECT *
FROM mytable
LIMIT 2, 3;
八、排序
- ASC :升序(默认)
- DESC :降序
可以按多个列进行排序,并且为每个列指定不同的排序方式:
语法:SELECT 列名 FROM 表名 WHERE 条件语句;
SELECT *
FROM mytable
ORDER BY col1 DESC, col2 ASC;
九、过滤
不进行过滤的数据非常大,导致通过网络传输了多余的数据,从而浪费了网络带宽。因此尽量使用 SQL 语句来过滤
不必要的数据,而不是传输所有的数据到客户端中然后由客户端进行过滤。
SELECT *
FROM mytable
WHERE col IS NULL;
WHERE子句可用的操作符
注意1:NULL 与 0、空字符串都不同。
注意2:在同时使用ORDER BY(排序)和WHERE子句时,应该让ORDER BY位于WHERE之后,否则会产生错误。
AND 和 OR 用于连接多个过滤条件。优先处理 AND,当一个过滤表达式涉及到多个 AND 和 OR 时,可以使用 () 来
决定优先级,使得优先级关系更清晰。
IN 操作符用于匹配一组值,其后也可以接一个 SELECT 子句,从而匹配子查询得到的一组值。
NOT 操作符用于否定一个条件。
关于过滤部分的SQL语句实例可参考 https://www.jianshu.com/p/7d847c23e2b8?utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendation
十、通配符
通配符也是用在过滤语句中,但它只能用于文本字段。
- % 匹配 >=0 个任意字符;
- _ 匹配 ==1 个任意字符;
- [ ]可以匹配集合内的字符,例如 [ab] 将匹配字符 a 或者 b。用脱字符 ^ 可以对其进行否定,也就是不匹配集合内的字符。
使用 Like 来进行通配符匹配。
SELECT *
FROM mytable
WHERE col LIKE ‘[^AB]’%; – 不以 A 和 B 开头的任意文本
不要滥用通配符,通配符位于开头处匹配会非常慢。
十一、计算字段
在数据库服务器上完成数据的转换和格式化的工作往往比客户端上快得多,并且转换和格式化后的数据量更少的话可以减少网络通信量。
计算字段通常需要使用 AS 来取别名,否则输出的时候字段名为计算表达式。
SELECT col1 * col2 AS alias
FROM mytable;
CONCAT() 用于连接两个字段(将值联结到一起构成单个值)。许多数据库会使用空格把一个值填充为列宽,因此连接的结果会出现一些不必要的空格,使用TRIM() 可以去除首尾空格。
SELECT CONCAT(TRIM(col1), ‘(’, TRIM(col2), ‘)’) AS concat_col
FROM mytable;
十二、函数
各个 DBMS 的函数都是不相同的,因此不可移植,以下主要是MySQL的函数。
1. 汇总
注意:AVG() 会忽略 NULL 行;使用 DISTINCT 可以汇总不同的值。
SELECT AVG(DISTINCT col1) AS avg_col
FROM mytable;
2. 文本处理
SOUNDEX() 可以将一个字符串转换为描述其语音表示的字母数字模式。
SELECT *
FROM mytable
WHERE SOUNDEX(col1) = SOUNDEX(‘apple’)
3. 日期和时间处理
- 日期格式:YYYY-MM-DD
- 时间格式:HH:MM:SS
mysql> SELECT NOW();
2018-4-14 20:25:11
4. 数值处理
十三、分组
把具有相同的数据值的行放在同一组中。
可以对同一分组数据使用汇总函数进行处理,例如求分组数据的平均值等。
指定的分组字段除了能按该字段进行分组,也会自动按该字段进行排序。
SELECT col, COUNT(*) AS num
FROM mytable
GROUP BY col; – 通过col分组,默认自动按分组字段进行排序
SELECT col, COUNT(*) AS num
FROM mytable
GROUP BY col
ORDER BY num;-- 按汇总字段来进行排序
WHERE 过滤行,HAVING 过滤分组,行过滤应当先于分组过滤。
SELECT col, COUNT(*) AS num
FROM mytable
WHERE col > 2
GROUP BY col
HAVING num >= 2;
分组规定:
-
GROUP BY 子句出现在 WHERE 子句之后,ORDER BY 子句之前;
-
除了汇总字段外,SELECT 语句中的每一字段都必须在GROUP BY 子句中给出;
-
NULL 的行会单独分为一组;
-
大多数 SQL 实现不支持 GROUP BY 列具有可变长度的数据类型。
十四、子查询
子查询中只能返回一个字段的数据。
可以将子查询的结果作为 WHRER 语句的过滤条件:
SELECT *
FROM mytable1
WHERE col1 IN (SELECT col2
FROM mytable2);
下面的语句可以检索出客户的订单数量,子查询语句会对第一个查询检索出的每个客户执行一次:
SELECT cust_name, (SELECT COUNT(*)
FROM Orders
WHERE Orders.cust_id = Customers.cust_id)
AS orders_num
FROM Customers
ORDER BY cust_name;
十五、连接
连接用于连接多个表,使用 JOIN 关键字,并且条件语句使用 ON 而不是 WHERE。
连接可以替换子查询,并且比子查询的效率一般会更快。
可以用 AS 给列名、计算字段和表名取别名,给表名取别名是为了简化 SQL 语句以及连接相同表。
1. 内连接
内连接又称等值连接,使用 INNER JOIN 关键字。
SELECT A.value, B.value
FROM tablea AS A INNER JOIN tableb AS B
ON A.key = B.key;
可以不明确使用 INNER JOIN,而使用普通查询并在 WHERE 中将两个表中要连接的列用等值方法连接起来。
SELECT A.value, B.value
FROM tablea AS A, tableb AS B
WHERE A.key = B.key;
2.自连接
自连接可以看成内连接的一种,只是连接的表是自身而已。
举例:一张员工表,包含员工姓名和员工所属部门,要找出与 Jim 处在同一部门的所有员工姓名。
(1) 子查询版本
SELECT name
FROM employee
WHERE department = (
SELECT department
FROM employee
WHERE name = “Jim”);
(2) 自连接版本
SELECT e1.name
FROM employee AS e1 INNER JOIN employee AS e2
ON e1.department = e2.department
AND e2.name = “Jim”;
(3) 自然连接
自然连接是把 同名列 通过等值测试连接起来的,同名列可以有多个。
内连接和自然连接的区别:内连接提供连接的列,而自然连接自动连接所有同名列。
SELECT A.value, B.value
FROM tablea AS A NATURAL JOIN tableb AS B;
(4) 外连接
外连接保留了没有关联的那些行。分为左外连接,右外连接以及全外连接,左外连接就是保留左表没有关联的行。
举例:检索所有顾客的订单信息,包括还没有订单信息的顾客。
SELECT Customers.cust_id, Orders.order_num
FROM Customers LEFT OUTER JOIN Orders
ON Customers.cust_id = Orders.cust_id;
customers 表
orders 表
结果
十六、组合查询
使用 UNION 来组合两个查询,如果第一个查询返回 M 行,第二个查询返回 N 行,那么组合查询的结果一般为M+N 行。
每个查询必须包含相同的列、表达式和聚集函数。默认会去除相同行,如果需要保留相同行,使用 UNION ALL。只能包含一个 ORDER BY 子句,并且必须位于语句的最后。
SELECT col
FROM mytable
WHERE col = 1
UNION
SELECT col
FROM mytable
WHERE col =2;
十七、视图
视图是虚拟的表,本身不包含数据,也就不能对其进行索引操作。对视图的操作和对普通表的操作一样。
视图具有如下好处:
- 简化复杂的 SQL 操作,比如复杂的连接;
- 只使用实际表的一部分数据;
- 通过只给用户访问视图的权限,保证数据的安全性;
- 更改数据格式和表示。
CREATE VIEW myview AS
SELECT Concat(col1, col2) AS concat_col, col3*col4 AS compute_col
FROM mytable
WHERE col5 = val;
十八、触发器
触发器执行条件:当某个表执行以下语句时自动执行 DELETE、INSERT、UPDATE。
触发器必须指定在语句执行之前还是之后自动执行,之前执行使用 BEFORE 关键字,之后执行使用 AFTER 关键字。BEFORE 用于数据验证和净化,AFTER 用于审计跟踪,将修改记录到另外一张表中。
举例:INSERT 触发器包含一个名为 NEW 的虚拟表。
CREATE TRIGGER mytrigger AFTER INSERT ON mytable
FOR EACH ROW SELECT NEW.col into @result;
SELECT @result; – 获取结果
DELETE 触发器包含一个名为 OLD 的虚拟表,并且是只读的。
UPDATE 触发器包含一个名为 NEW 和一个名为 OLD 的虚拟表,其中 NEW 是可以被修改的,而 OLD 是只读的。
MySQL 不允许在触发器中使用 CALL 语句,也就是不能调用存储过程。