for循环和forall循环的区别

本文详细解释了在PL/SQL中使用FORALL和FORLOOP的区别,以及如何利用批量绑定提高性能。通过实例演示了FORALL语法的优势,并与FORLOOP进行了对比,包括触发器行为、SQL_TRACE分析和事务一致性处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

2、使用批量绑定优化PL/SQL

当SQL在集合的循环内执行时,PL/SQL和SQL引擎间的频繁切换就会影响到执行速度。例如,下面的UPDATE语句就在FOR语句中不断发送到SQL引擎:

DECLARE
  TYPE numlist IS VARRAY(20) OF NUMBER;
  depts numlist := numlist(10, 30, 70, .. .);   -- department numbers
BEGIN
  ...
  FOR IN depts.FIRST .. depts.LAST LOOP
    ...
    UPDATE emp SET sal sal 1.10 WHERE deptno depts(i);
  END LOOP;
END;

在这样的情况下,如果SQL语句影响到四行或更多行数据时,使用批量绑定就会显著地提高性能。例如,下面的UPDATE语句可以一次就把整个嵌套表的数据发送到SQL引擎中:

FORALL IN depts.FIRST..depts.LAST
  UPDATE emp SET sal sal 1.10 WHERE deptno depts(i);

要想尽最大可能地提高性能,我们就需要像下面这样编写程序:

  1. 如果一条INSERT、UPDATE或DELETE语句在循环内执行,并且引用到集合中的元素,那么,就把它放到FORALL语句中去。
  2. 如果SELECT INTO、FETCHE INTO或RETURNING INTO子句引用了一个集合,那就配合BULK COLLECT子句一起使用。
  3. 如果可能的话,尽量在应用程序和服务器之间使用主数组传递集合。
  4. 如果DML操作失败时且不是很重大的问题,就可以在FORALL语句中使用SAVE EXCEPTIONS,然后在以后的循环中使用%BULK_EXCEPTIONS属性报告或清除错误。

不要忽略这些小问题,因为它们可以帮助我们分析流程控制和程序的依赖性。

 

 

同事问了我一个问题,使用FOR ALLFOR LOOP的区别到底是什么。以前也一直没有深究这个问题,唯一清楚的是FOR ALL是一个批量操作,效率明显比FOR LOOP的方式要高,至于FOR ALL到底是一个SQL语句,还是将多个SQL语句同时提交给ORACLE还真不太清楚。

 

 


于是,首先做了个简单的例子,但是通过触发器来观察二者的区别:

SQL> CREATE TABLE TTT (ID NUMBER);

表已创建。

SQL> CREATE OR REPLACE TRIGGER TRI_TTT BEFORE INSERT ON TTT
2 BEGIN
3 DBMS_OUTPUT.PUT_LINE('A');
4 END;
5 /

触发器已创建

SQL> SET SERVEROUT ON
SQL> DECLARE
2 TYPE T_NUM_TABLE IS TABLE OF NUMBER INDEX BY BINARY_INTEGER;
3 V_NUM T_NUM_TABLE;
4 BEGIN
5 SELECT ROWNUM BULK COLLECT INTO V_NUM FROM TAB;
6 FOR I IN 1..V_NUM.COUNT LOOP
7 INSERT INTO TTT VALUES (V_NUM(I));
8 END LOOP;
9 END;
10 /
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A

PL/SQL 过程已成功完成。

SQL> DECLARE
2 TYPE T_NUM_TABLE IS TABLE OF NUMBER INDEX BY BINARY_INTEGER;
3 V_NUM T_NUM_TABLE;
4 BEGIN
5 SELECT ROWNUM BULK COLLECT INTO V_NUM FROM TAB;
6 FORALL I IN 1..V_NUM.COUNT
7 INSERT INTO TTT VALUES (V_NUM(I));
8 END;
9 /
A

PL/SQL 过程已成功完成。

从触发器的除非动作上可以看出,FOR ALL语法和FOR LOOP的区别,FOR ALLINSERT语句只调用了一次。

通过SQL_TRACE的方式也可以清楚的看到这一点:

SQL> DROP TRIGGER TRI_TTT;

触发器已删除。

SQL> ALTER SESSION SET SQL_TRACE = TRUE;

会话已更改。

SQL> DECLARE
2 TYPE T_NUM_TABLE IS TABLE OF NUMBER INDEX BY BINARY_INTEGER;
3 V_NUM T_NUM_TABLE;
4 BEGIN
5 SELECT ROWNUM BULK COLLECT INTO V_NUM FROM TAB;
6 FORALL I IN 1..V_NUM.COUNT
7 INSERT INTO TTT VALUES (V_NUM(I));
8 END;
9 /

PL/SQL 过程已成功完成。

SQL> ALTER SESSION SET SQL_TRACE = FALSE;

会话已更改。

SQL> ALTER SESSION SET SQL_TRACE = TRUE;

会话已更改。

SQL> DECLARE
2 TYPE T_NUM_TABLE IS TABLE OF NUMBER INDEX BY BINARY_INTEGER;
3 V_NUM T_NUM_TABLE;
4 BEGIN
5 SELECT ROWNUM BULK COLLECT INTO V_NUM FROM TAB;
6 FOR I IN 1..V_NUM.COUNT LOOP
7 INSERT INTO TTT VALUES (V_NUM(I));
8 END LOOP;
9 END;
10 /

PL/SQL 过程已成功完成。

SQL> ALTER SESSION SET SQL_TRACE = FALSE;

会话已更改。

SQL> HOST TKPROF E:ORACLEADMINYTKUDUMPYTK_ORA_3964.TRC E:REPORT.TXT SYS=NO AGGREGATE=NO

其中FOR ALL语句对应的INSERT语句为:

INSERT INTO TTT
VALUES
(:B1 )


call count cpu elapsed disk query current rows
------- ------ -------- ---------- ---------- ---------- ---------- ---------
Parse 1 0.00 0.00 0 0 0 0
Execute 1 0.00 0.00 0 1 5 16
Fetch 0 0.00 0.00 0 0 0 0
------- ------ -------- ---------- ---------- ---------- ---------- ---------
total 2 0.00 0.00 0 1 5 16

FOR LOOP对应的INSERT语句为:

INSERT INTO TTT
VALUES
(:B1 )


call count cpu elapsed disk query current rows
------- ------ -------- ---------- ---------- ---------- ---------- ---------
Parse 1 0.00 0.00 0 0 0 0
Execute 16 0.00 0.06 4 1 20 16
Fetch 0 0.00 0.00 0 0 0 0
------- ------ -------- ---------- ---------- ---------- ---------- ---------
total 17 0.00 0.06 4 1 20 16

从上面的TKPROF可以更清楚的看出,对于FOR ALL语法,INSERT语句只是执行了一次,但是产生了16条记录。从这一点上,FOR ALL语法于INSERT INTO SELECT语法更为相似。但FOR ALL又和INSERT INTO SELECT有着本质的区别:

SQL> TRUNCATE TABLE TTT;

表被截断。

SQL> ALTER TABLE TTT MODIFY ID NUMBER(3);

表已更改。

SQL> INSERT INTO TTT SELECT 994 + ROWNUM FROM TAB;
INSERT INTO TTT SELECT 994 + ROWNUM FROM TAB
*
第 1 行出现错误:
ORA-01438:
 值大于为此列指定的允许精度


SQL> SELECT * FROM TTT;

未选定行

INSERT INTO SELECT语法属于一条语句,根据Oracle的语句级回滚,当插入由于个别数据发生错误的时候,整个插入语句被回滚。

但对于FOR ALL语句,虽然Oracle只执行了INSERT语句一次,但是,如果发生了错误,是可以捕获的,且错误发生之间的操作是可以保留下来的。

SQL> DECLARE
2 TYPE T_NUM_TABLE IS TABLE OF NUMBER INDEX BY BINARY_INTEGER;
3 V_NUM T_NUM_TABLE;
4 BEGIN
5 SELECT ROWNUM BULK COLLECT INTO V_NUM FROM TAB;
6 V_NUM(5) := 1000;
7 BEGIN
8 FORALL I IN 1..V_NUM.COUNT
9 INSERT INTO TTT VALUES (V_NUM(I));
10 EXCEPTION
11 WHEN OTHERS THEN
12 COMMIT;
13 END;
14 END;
15 /

PL/SQL 过程已成功完成。

SQL> SELECT * FROM TTT;

ID
----------
1
2
3
4

从这一点看,FOR ALL语法和INSERT INTO SELECT又有着本质的区别。个人感觉FOR ALL语法和OracleOCI中数组绑定语法十分类似。二者都采用数据绑定变量的方式,通过调用一次SQL将整个数组的内容提交给Oracle并且出现错误后,可以通过捕获错误的方式保留出错前已经进行的修改。

(转帖时注:请注意试验中是写了commit的,所以保留出错前的修改,但是这里如果考虑事物一致性就要判断是否应该写commit。)

个人认为,FOR ALL语法和OCI的数组绑定具有相同的内部机制。二者分别为PL/SQLOCI提供了相同的批量处理功能。

<think>好的,我现在需要比较数据库操作中的findAll()for循环的性能适用场景。首先,我得明确这两个方法的基本概念使用方式。 findAll()通常是ORM(对象关系映射)框架提供的方法,用于一次性从数据库中检索多条记录。比如在Sequelize或Hibernate中,使用findAll()可以获取符合条件的所有数据,然后以数组或列表的形式返回。这样用户可以在内存中直接处理这些数据。 而for循环遍历,可能指的是先获取少量数据(比如逐条查询),然后在循环中逐个处理。例如,先查询一个订单列表的ID,再在循环中根据每个ID查询详细信息。这种情况下,每次循环都会发起一次数据库查询。 接下来要考虑性能差异。一般来说,数据库操作的网络延迟I/O开销较大。如果使用for循环多次查询,每次查询都会有这些开销,而findAll()一次性获取所有数据,减少了重复的网络通信数据库连接次数。例如,假设要获取100条数据,使用findAll()只需要一次查询,而for循环可能需要100次查询,导致性能明显下降。不过,如果单次findAll()获取的数据量非常大,可能会占用过多内存,甚至导致应用程序变慢或崩溃,这时候分页查询可能更合适。 适用场景方面,findAll()适合需要批量处理数据的场景,比如报表生成、数据分析,或者需要关联多个表进行复杂查询的情况。而for循环可能适用于需要逐条处理、实时性要求高,或者数据量特别大必须分页的情况。不过,即使数据量大,也应该优先考虑分页的findAll()而不是逐条查询,以减少数据库压力。 还需要注意ORM的缓存机制。有些ORM框架会对查询结果进行缓存,多次findAll()可能比多次for循环查询更高效,因为后续查询可能直接读缓存。此外,数据库本身的优化,比如索引,也会影响这两种方法的性能。如果for循环中的查询条件没有合适的索引,性能会急剧下降。 另外,事务处理也是一个因素。在事务中,多次for循环查询可能会延长事务时间,增加锁竞争的风险,而findAll()一次性获取数据可以减少事务持续时间。 总结下来,性能方面findAll()通常更优,但要注意数据量;适用场景则根据数据量、处理方式实时性需求来选择。还要考虑数据库设计,比如反规范化可能提升查询性能,但需要平衡规范化性能的关系[^1]。同时,数据库的行格式如Dynamic或Compressed在存储大数据时处理溢出页的方式也会影响I/O性能[^2]。</think>### 数据库操作 `findAll()` vs `for` 循环的性能与适用场景 #### 1. **基本概念与用法** - **`findAll()`**: 通常是ORM(如Sequelize、Hibernate)提供的方法,用于一次性从数据库检索满足条件的所有记录,返回数据集(如数组或列表)。例如: ```javascript // Sequelize示例 const users = await User.findAll({ where: { age: { [Op.gt]: 18 } } }); ``` - **`for` 循环遍历**: 可能指逐条查询(如循环中多次查询单条数据)或逐条处理已加载的数据。例如: ```python # 伪代码示例(逐条查询) user_ids = [1, 2, 3] for id in user_ids: user = User.query.get(id) # 每次循环发起一次查询 ``` --- #### 2. **性能差异分析** | **维度** | **`findAll()`** | **`for` 循环逐条查询** | |------------------|---------------------------------------------|------------------------------------------| | **数据库交互次数** | 1次(批量获取) | N次(逐条查询) | | **网络延迟** | 低(单次请求) | 高(多次请求叠加) | | **内存占用** | 高(一次性加载所有数据) | 低(单条数据逐次加载) | | **适用数据量** | 中小规模数据(需避免内存溢出) | 极大数据量(需分页或流式处理) | | **索引利用率** | 高(可通过复合索引优化查询) | 低(多次单条查询可能无法高效利用索引) | --- #### 3. **适用场景** - **优先使用 `findAll()`**: - 需要批量处理数据(如生成报表、导出数据)。 - 涉及关联查询(如JOIN多张表)。 - 事务中需保持数据一致性(减少多次查询的锁竞争)。 - **谨慎使用 `for` 循环逐条查询**: - 数据量极大且无法分页(需结合流式查询或游标)。 - 实时性要求极高(如逐条处理并实时反馈)。 - 单条查询涉及复杂计算(如调用数据库函数)。 --- #### 4. **优化建议** 1. **分页查询**: 使用 `findAll()` 结合 `LIMIT` `OFFSET` 分页,避免一次性加载过多数据。 ```sql SELECT * FROM users WHERE age > 18 LIMIT 100 OFFSET 0; ``` 2. **预加载关联数据**: 通过ORM的 `include` 或 `JOIN` 减少N+1查询问题[^1]。 3. **数据库反规范化**: 对高频查询字段适当冗余,减少关联查询次数。 4. **索引优化**: 为 `WHERE` 条件或排序字段添加索引,提升 `findAll()` 效率。 --- #### 5. **性能测试示例** 假设查询1000条用户数据: - **`findAll()`**:1次查询,耗时约50ms。 - **`for` 循环逐条查询**:1000次查询,耗时约1000ms(假设每次查询1ms,未考虑网络延迟)。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值