1. 书写格式
示例代码:
存储过程SQL
文书写格式例
C# 中里的SQL 字符串书写格式例
























































1).缩进
对于存储过程文件,缩进为8
个空格
对于C#
里的SQL
字符串,不可有缩进,即每一行字符串不可以空格开头
2).
换行
1>.Select/From/Where/Order by/Group by
等子句必须另其一行写
2>.Select
子句内容如果只有一项,与Select
同行写
3>.Select
子句内容如果多于一项,每一项单独占一行,在对应Select
的基础上向右缩进8
个空格(C#
无缩进)
4>.From
子句内容如果只有一项,与From
同行写
5>.From
子句内容如果多于一项,每一项单独占一行,在对应From
的基础上向右缩进8
个空格(C#
无缩进)
6>.Where
子句的条件如果有多项,每一个条件占一行,以AND
开头,且无缩进
7>.(Update)Set
子句内容每一项单独占一行,无缩进
8>.Insert
子句内容每个表字段单独占一行,无缩进;values
每一项单独占一行,无缩进
9>.SQL
文中间不允许出现空行
10>.C#
里单引号必须跟所属的SQL
子句处在同一行,连接符("+"
)必须在行首
3).
空格
1>.SQL
内算数运算符、逻辑运算符连接的两个元素之间必须用空格分隔
2>.
逗号之后必须接一个空格
3>.
关键字、保留字和左括号之间必须有一个空格
2.
不等于统一使用"<>"
。虽然 SQLServer
认为"!="
和"<>"
是等价的,都代表不等于的意义。为了统一,不等于一律使用"<>"
表示
3.
使用表的别名,
数据库查询,必须使用表的别名。
4.SQL
文对表字段扩展的兼容性。在C#
里使用Select *
时,严禁通过getString(1)
的形式得到查询结果,必须使用getString("
字段名")
的形式;使用Insert
时,必须指定插入的字段名,严禁不指定字段名直接插入values
5.
减少子查询的使用。子查询除了可读性差之外,还在一定程度上影响了SQL
运行效率,请尽量减少使用子查询的使用,用其他效率更高、可读性更好的方式替代。
6.
适当添加索引以提高查询效率,适当添加索引可以大幅度的提高检索速度,请参看SQLSERVER SQL
性能优化系列。
7.
对数据库表操作的特殊要求
本项目对数据库表的操作还有以下特殊要求:
1).
以逻辑删除替代物理删除
注意:现在数据库表中数据没有物理删除,只有逻辑删除
以deleteflag
字段作为删除标志,deleteflag='1'
代表此记录被逻辑删除,因此在查询数据时必须考虑deleteflag
的因素,deleteflag
的标准查询条件:NVL(deleteflag, '0') <> '1'
2).
增加记录状态字段
数据库中的每张表基本都有以下字段:DELETEFLAG
、UPDATECOUNT
、CREDATE
、CREUSER
、UPDATETIME
、UPDATEUSER
要注意在对标进行操作时必须考虑以下字段
插入一条记录时要置DELETEFLAG='0', UPDATECOUNT=0, CREDATE=sysdate, CREUSER=
登录User
;查询一条记录时要考虑DELETEFLAG
,如果有可能对此记录作更新时还要取得UPDATECOUNT
作同步检查 ;修改一条记录时要置UPDATETIME=sysdate, UPDATEUSER=
登录User, UPDATECOUNT=(UPDATECOUNT+1) mod 1000,
;删除一条记录时要置DELETEFLAG='1'
3).
历史表
数据库里部分表还存在相应的历史表,比如srv_twc_f
和srv_twchistory_f
,在查询数据时除了检索所在表之外,还必须检索相应的历史表,对二者的结果做Union
(或Union All
)
8.
用执行计划分析SQL
性能
EXPLAIN PLAN
是一个很好的分析SQL
语句的工具,它可以在不执行SQL
的情况下分析语句。通过分析,我们就可以知道SQLSERVER
是怎样连接表,使用什么方式扫描表(索引扫描或全表扫描),以及使用到的索引名称,按照从里到外,从上到下的次序解读分析的结果,EXPLAIN PLAN
的分析结果是用缩进的格式排列的,最内部的操作将最先被解读,如果两个操作处于同一层中,带有最小操作号的将首先被执行。目前许多第三方的工具如PLSQL Developer
和TOAD
等都提供了极其方便的EXPLAIN PLAN
工具,PG
需要将自己添加的查询SQL
文记入log
,然后在EXPLAIN PLAN
中进行分析,尽量减少全表扫描,
SQLSERVER SQL
性能优化系列
1.
选择最有效率的表名顺序(
只在基于规则的优化器中有效)
SQLSERVER
的解析器按照从右到左的顺序处理FROM
子句中的表名,因此FROM
子句中写在最后的表(基础表driving table
)将被最先处理,在FROM
子句中包含多个表的情况下,必须选择记录条数最少的表作为基础表,当SQLSERVER
处理多个表时,会运用排序及合并的方式连接它们,
首先,扫描第一个表(FROM 子句中最后的那个表) 并对记录进行排序;然后扫描第二个表(FROM 子句中最后第二个表) ;最后将所有从第二个表中检索出的记录与第一个表中合适记录进行合并
例如: 表 TAB1 16,384 条记录表 TAB2 5 条记录,选择TAB2 作为基础表 ( 最好的方法) select count(*) from tab1,tab2 执行时间0.96 秒,选择TAB2 作为基础表 ( 不佳的方法) select count(*) from tab2,tab1 执行时间26.09 秒;
如果有3
个以上的表连接查询,那就需要选择交叉表(intersection table
)作为基础表,交叉表是指那个被其他表所引用的表
例如:
EMP
表描述了LOCATION
表和CATEGORY
表的交集
将比下列SQL
更有效率
SELECT
*
FROM
EMP E ,
LOCATION L ,
CATEGORY C
WHERE
E.CAT_NO
=
C.CAT_NO
AND
E.LOCN
=
L.LOCN
AND
E.EMP_NO
BETWEEN
1000
AND
2000
SQLSERVER
采用自下而上的顺序解析WHERE
子句,根据这个原理,表之间的连接必须写在其他WHERE
条件之前,那些可以过滤掉最大数量记录的条件必须写在WHERE
子句的末尾
例如:
(
低效,
执行时间156.3
秒)
SELECT
*
FROM
EMP E
WHERE
SAL
>
50000
AND
JOB
=
'
MANAGER
'
AND
25
<
(
SELECT
COUNT
(
*
)
FROM
EMP
WHERE
MGR
=
E.EMPNO);
SELECT
*
FROM
EMP E
WHERE
25
<
(
SELECT
COUNT
(
*
)
FROM
EMP
WHERE
MGR
=
E.EMPNO)
AND
SAL
>
50000
AND
JOB
=
'
MANAGER
'
;
4.
减少访问数据库的次数。当执行每条SQL
语句时,SQLSERVER
在内部执行了许多工作:解析SQL
语句,估算索引的利用率,绑定变量,读数据块等等
由此可见,减少访问数据库的次数,就能实际上减少SQLSERVER
的工作量,例如:
以下有三种方法可以检索出雇员号等于0342
或0291
的职员
方法1 (
最低效)
方法2 (
次低效)
DECLARE
CURSOR
C1 (E_NO
NUMBER
)
IS
SELECT
EMP_NAME,SALARY,GRADE
FROM
EMP
WHERE
EMP_NO
=
E_NO;
BEGIN
OPEN
C1(
342
);
FETCH
C1
INTO
…,…,…;
…
OPEN
C1(
291
);
FETCH
C1
INTO
…,…,…;
…
CLOSE
C1;
END
;
SELECT
A.EMP_NAME, A.SALARY, A.GRADE,
B.EMP_NAME, B.SALARY, B.GRADE
FROM
EMP A, EMP B
WHERE
A.EMP_NO
=
342
AND
B.EMP_NO
=
291
;
高效
使用DECODE
函数可以避免重复扫描相同记录或重复连接相同的表
例如:
你可以用DECODE
函数高效地得到相同结果
SELECT
COUNT
(DECODE(DEPT_NO,
'
0020
'
,
'
X
'
,
NULL
)) D0020_COUNT,
COUNT
(DECODE(DEPT_NO,
'
0030
'
,
'
X
'
,
NULL
)) D0030_COUNT,
SUM
(DECODE(DEPT_NO,
'
0020
'
, SAL,
NULL
)) D0020_SAL,
SUM
(DECODE(DEPT_NO,
0030
, SAL,
NULL
)) D0030_SAL
FROM
EMP
WHERE
ENAME
LIKE
'
SMITH%
'
;
类似的,DECODE
函数也可以运用于GROUP BY
和ORDER BY
子句中
6.
用Where
子句替换HAVING
子句
避免使用HAVING
子句,HAVING
只会在检索出所有记录之后才对结果集进行过滤,这个处理需要排序、统计等操作
如果能通过WHERE
子句限制记录的数目,那就能减少这方面的开销
例如:
低效
SELECT
REGION,
AVG
(LOG_SIZE)
FROM
LOCATION
GROUP
BY
REGION
HAVING
REGION REGION
!=
'
SYDNEY
'
AND
REGION
!=
'
PERTH
'
SELECT
REGION,
AVG
(LOG_SIZE)
FROM
LOCATION
WHERE
REGION REGION
!=
'
SYDNEY
'
AND
REGION
!=
'
PERTH
'
GROUP
BY
REGION
在含有子查询的SQL
语句中,要特别注意减少对表的查询
例如:
低效
SELECT
TAB_NAME
FROM
TABLES
WHERE
TAB_NAME
=
(
SELECT
TAB_NAME
FROM
TAB_COLUMNS
WHERE
VERSION
=
604
)
AND
DB_VER
=
(
SELECT
DB_VER
FROM
TAB_COLUMNS
WHERE
VERSION
=
604
)
SELECT
TAB_NAME
FROM
TABLES
WHERE
(TAB_NAME, DB_VER)
=
(
SELECT
TAB_NAME, DB_VER
FROM
TAB_COLUMNS
WHERE
VERSION
=
604
)
低效
UPDATE
EMP
SET
EMP_CAT
=
(
SELECT
MAX
(CATEGORY)
FROM
EMP_CATEGORIES),
SAL_RANGE
=
(
SELECT
MAX
(SAL_RANGE)
FROM
EMP_CATEGORIES)
WHERE
EMP_DEPT
=
0020
;
UPDATE
EMP
SET
(EMP_CAT, SAL_RANGE)
=
(
SELECT
MAX
(CATEGORY),
MAX
(SAL_RANGE)
FROM
EMP_CATEGORIES)
WHERE
EMP_DEPT
=
0020
;
9.
用EXISTS
替代IN
在许多基于基础表的查询中,为了满足一个条件,往往需要对另一个表进行联接
在这种情况下,使用EXISTS(
或NOT EXISTS)
通常将提高查询的效率
低效
SELECT
*
FROM
EMP (基础表)
WHERE
EMPNO
>
0
AND
DEPTNO
IN
(
SELECT
DEPTNO
FROM
DEPT
WHERE
LOC
=
'
MELB
'
)
SELECT
*
FROM
EMP (基础表)
WHERE
EMPNO
>
0
AND
EXISTS
(
SELECT
'
X
'
FROM
DEPT
WHERE
DEPT.DEPTNO
=
EMP.DEPTNO
AND
LOC
=
'
MELB
'
)
在子查询中,NOT IN
子句将执行一个内部的排序和合并
无论在哪种情况下,NOT IN
都是最低效的,因为它对子查询中的表执行了一个全表遍历
为了避免使用NOT IN
,我们可以把它改写成外连接(Outer Joins)
或NOT EXISTS
例如:
SELECT
…
FROM
EMP
WHERE
DEPT_NO
NOT
IN
(
SELECT
DEPT_NO
FROM
DEPT
WHERE
DEPT_CAT
=
'
A
'
);
高效
SELECT
…
FROM
EMP A, DEPT B
WHERE
A.DEPT_NO
=
B.DEPT(
+
)
AND
B.DEPT_NO
IS
NULL
AND
B.DEPT_CAT(
+
)
=
'
A
'
SELECT
…
FROM
EMP E
WHERE
NOT
EXISTS
(
SELECT
'
X
'
FROM
DEPT D
WHERE
D.DEPT_NO
=
E.DEPT_NO
AND
DEPT_CAT
=
'
A
'
);
通常来说,采用表连接的方式比EXISTS
更有效率
例如:
SELECT
ENAME
FROM
EMP E
WHERE
EXISTS
(
SELECT
'
X
'
FROM
DEPT
WHERE
DEPT_NO
=
E.DEPT_NO
AND
DEPT_CAT
=
'
A
'
);
SELECT
ENAME
FROM
DEPT D, EMP E
WHERE
E.DEPT_NO
=
D.DEPT_NO
AND
DEPT_CAT
=
'
A
'
;
当提交一个包含多表信息(比如部门表和雇员表)的查询时,避免在SELECT
子句中使用DISTINCT
,一般可以考虑用EXIST
替换
例如:
低效
SELECT
DISTINCT
DEPT_NO, DEPT_NAME
FROM
DEPT D, EMP E
WHERE
D.DEPT_NO
=
E.DEPT_NO
SELECT
DEPT_NO, DEPT_NAME
FROM
DEPT D
WHERE
EXISTS
(
SELECT
'
X
'
FROM
EMP E
WHERE
E.DEPT_NO
=
D.DEPT_NO);
13.
用索引提高效率
索引是表的一个概念部分,用来提高检索数据的效率。实际上,SQLSERVER
使用了一个复杂的自平衡B-tree
结构
通常,通过索引查询数据比全表扫描要快。当SQLSERVER
找出执行查询和Update
语句的最佳路径时,SQLSERVER
优化器将使用索引
同样,在联结多个表时使用索引也可以提高效率。另一个使用索引的好处是,它提供了主键(primary key
)的唯一性验证
除了那些LONG
或LONG RAW
数据类型,你可以索引几乎所有的列
通常在大型表中使用索引特别有效,当然,在扫描小表时,使用索引同样能提高效率
虽然使用索引能得到查询效率的提高,但是我们也必须注意到它的代价
索引需要空间来存储,也需要定期维护,每当有记录在表中增减或索引列被修改时,索引本身也会被修改
这意味着每条记录的INSERT
、DELETE
、UPDATE
将为此多付出4
、5
次的磁盘I/O
因为索引需要额外的存储空间和处理,那些不必要的索引反而会使查询反应时间变慢
SQLSERVER
对索引有两种访问模式:
1).
索引唯一扫描(INDEX UNIQUE SCAN
)
大多数情况下,
优化器通过WHERE
子句访问INDEX
例如:
表LODGING
有两个索引:建立在LODGING
列上的唯一性索引LODGING_PK
和建立在MANAGER
列上的非唯一性索引LODGING$MANAGER
SELECT
*
FROM
LODGING
WHERE
LODGING
=
'
ROSE HILL
'
;
首先,LODGING_PK
索引将通过索引唯一扫描的方式被访问,获得相对应的ROWID
;然后通过ROWID
访问表的方式执行下一步检索
如果被检索返回的列包括在INDEX
列中,SQLSERVER
将不执行第二步的处理(通过ROWID
访问表)
因为检索数据保存在索引中,单单访问索引就可以完全满足查询结果
2).
索引范围查询(INDEX RANGE SCAN)
适用于两种情况:
1>.
基于唯一性索引的一个范围的检索
2>.
基于非唯一性索引的检索
例1
SELECT
LODGING
FROM
LODGING
WHERE
LODGING
LIKE
'
M%
'
;
WHERE子句条件包括一系列值,SQLSERVER
将通过索引范围查询的方式查询LODGING_PK
由于索引范围查询将返回一组值,它的效率就要比索引唯一扫描低一些
例2
SELECT
LODGING
FROM
LODGING
WHERE
MANAGER
=
'
BILL GATES
'
;
这个SQL
的执行分两步,LODGING$MANAGER
的索引范围查询(得到所有符合条件记录的ROWID
),通过ROWID
访问表得到LODGING
列的值
由于LODGING$MANAGER
是一个非唯一性的索引,数据库不能对它执行索引唯一扫描
WHERE
子句中,如果索引列所对应的值的第一个字符由通配符(WILDCARD
)开始,索引将不被采用
SELECT
LODGING
FROM
LODGING
WHERE
MANAGER
LIKE
'
%HANMAN
'
;
14.
避免在索引列上使用计算
WHERE
子句中,如果索引列是函数的一部分,优化器将不使用索引而使用全表扫描
例如:
低效
SELECT
…
FROM
DEPT
WHERE
SAL
*
12
>
25000
;
SELECT
…
FROM
DEPT
WHERE
SAL
>
25000
/
12
;
15.
避免在索引列上使用IS NULL
和IS NOT NULL
避免在索引中使用任何可以为空的列,SQLSERVER
将无法使用该索引
对于单列索引,如果列包含空值,索引中将不存在此记录;
对于复合索引,如果每个列都为空,索引中同样不存在此记录。如果至少有一个列不为空,则记录存在于索引中
如果唯一性索引建立在表的A
列和B
列上,并且表中存在一条记录的A,B
值为(123,null)
,
SQLSERVER
将不接受下一条具有相同A,B
值(123,null
)的记录插入
如果所有的索引列都为空,SQLSERVER
将认为整个键值为空,而空不可能等于空,因此你可以插入1000
条具有相同键值的记录,当然它们都是空!
因为空值不存在于索引列中,所以WHERE
子句中对索引列进行空值比较将使SQLSERVER
停用该索引
低效(索引失效)
SELECT …
FROM DEPARTMENT
WHERE DEPT_CODE IS NOT NULL
当SQL
语句需要UNION
两个查询结果集合时,这两个结果集合会以UNION-ALL
的方式被合并,然后在输出最终结果前进行排序
如果用UNION ALL
替代UNION
,这样排序就不是必要了,效率就会因此得到提高
需要注意的是,UNION ALL
将重复输出两个结果集合中相同记录,因此还是要从业务需求分析使用UNION ALL
的可行性
关于索引下列经验请参考:
1).
如果检索数据量超过30%
的表中记录数,使用索引将没有显著的效率提高
2).
在特定情况下,使用索引也许会比全表扫描慢,但这是同一个数量级上的差距;而通常情况下,使用索引比全表扫描要快几倍乃至几千倍!

















SELECT
*
FROM
LOCATION L,
CATEGORY C,
EMP E
WHERE
E.EMP_NO
BETWEEN
1000
AND
2000
AND
E.CAT_NO
=
C.CAT_NO
AND
E.LOCN
=
L.LOCN