44、《if 语句的原理、优化与布尔求值控制》

r2s3t4

于 2025-08-29 14:45:32 发布

阅读量27

点赞数

CC 4.0 BY-SA版权

分类专栏：低维思考、高维编码文章标签： if语句布尔求值短路求值

本文链接：https://blog.youkuaiyun.com/r2s3t4/article/details/151276189

低维思考、高维编码专栏收录该内容

53 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

《if 语句的原理、优化与布尔求值控制》

1. if 语句基础

if 语句是最基本的高级控制结构，仅使用 if 和 goto 语句，在语义上就能实现所有其他控制结构。对于简单的 if 语句，比较两个值，若条件为真则执行语句体，通常可用单个比较和条件分支指令实现。

简单 if 语句示例
- Pascal 代码

if( EAX = EBX ) then begin
    writeln( "EAX is equal to EBX" );
    i := i + 1;
end;

- **80x86/HLA 汇编代码**

cmp( EAX, EBX );
jne skipIfBody;
stdout.put( "EAX is equal to EBX", nl );
inc( i );
skipIfBody:

在上述 Pascal 代码中，当 EAX 等于 EBX 时，执行 if 语句体。汇编代码中，先比较 EAX 和 EBX，若不相等则跳过 if 语句体。

if..then..else 语句示例
- C/C++ 代码

if( EAX == EBX )
{
    printf( "EAX is equal to EBX\n" );
    ++i;
}
else
{
    printf( "EAX is not equal to EBX\n" );
}

- **80x86/HLA 汇编代码**

cmp( EAX, EBX );        // See if EAX == EBX
jne doElse;             // Branch around "Then" code
stdout.put( "EAX is equal to EBX", nl );
inc( i );
jmp skipElseBody        // Skip over "else" section.
// if they are not equal.
doElse:
    stdout.put( "EAX is not equal to EBX", nl );
skipElseBody:

此代码有两点需注意：一是条件为假时，代码跳转到 else 块的第一条语句；二是真子句末尾的 jmp 指令用于跳过 else 块。

含 elseif 子句的 if 语句示例
- HLA 代码

if( EAX = EBX ) then
    stdout.put( "EAX is equal to EBX" nl );
    inc( i );
elseif( EAX = ECX ) then
    stdout.put( "EAX is equal to ECX" nl );
else
    stdout.put( "EAX is not equal to EBX or ECX" nl);
endif;

- **80x86/HLA 汇编代码**

// Test to see if EAX = EBX
cmp( eax, ebx );                                    
jne tryElseif; // Skip "then" section if not equal
// Start of the "then" section
stdout.put( "EAX is equal to EBX", nl );            
inc( i );
jmp skipElseBody // End of "then" section, skip 
                 // over the elseif clause.
tryElseif:
    cmp( eax, ecx ); // ELSEIF test for EAX = ECX
    jne doElse;      // Skip "then" clause if not equal
    // ELSEIF "then" clause
    stdout.put( "EAX is equal to ECX", nl ); 
    jmp skipElseBody; // Skip over the "else" section
doElse: // ELSE clause begins here
    stdout.put( "EAX is not equal to EBX or ECX", nl );
skipElseBody:

elseif 子句的机器代码与 if 语句相同，只是 if..then 子句末尾有 jmp 指令跳过 elseif 子句的布尔测试。

2. 提高特定 if/else 语句的效率

从效率角度看，if..else 语句的每条执行路径都涉及控制转移，而简单 if 语句在条件为真时可直接执行。分支操作会刷新 CPU 的指令流水线，重新填充流水线需多个 CPU 周期，因此会影响效率。

根据条件可能性优化
若布尔表达式的两种结果可能性相同，调整 if..else 语句对性能提升不大；但多数情况下，一种结果更可能出现。汇编程序员会按如下方式编码：

cmp( EAX, EBX );
jne goDoElse;
stdout.put( "EAX is equal to EBX", nl );
backFromElse:
    ...
// Somewhere else in the code:
doElse:
    stdout.put( "EAX is not equal to EBX", nl );
    jmp backFromElse

若表达式多数情况下为真，代码可直接执行 then 部分，无需分支；仅在少数情况下执行两个分支。在高级语言（如 C）中，可使用 goto 语句实现相同效果：

if( eax != ebx ) goto doElseStuff;
    // << body of the if statement goes here>>
    // (statements between THEN and ELSE)
endOfIF:
    // << statements following the IF..ENDIF statement >>
    ...
doElseStuff:
    << Code to do if the expression is false >>
    goto endOfIF;

不过，这种方法会产生难以阅读的“ spaghetti code”，在高级语言中一般不推荐，仅在必要时使用。

减少控制转移指令
常见的 if 语句转换为汇编语言时，需两条控制转移指令。例如：

if( eax == ebx )
{
    i = j + 5;  
}
else
{
    i = 0;    
}

其 80x86/HLA 汇编代码为：

cmp( eax, ebx );
jne doElse;
mov( j, edx );
add( 5, edx );
mov( edx, i );
jmp ifDone;
doElse:
    mov( 0, i );
ifDone:

无论走哪条路径，CPU 都会执行慢的分支指令，刷新指令流水线。可采用以下代码优化：

i = 0;
if( eax == ebx )
{
    i = j + 5;
}

其 80x86 汇编代码为：

mov( 0, i );
cmp( eax, ebx );
jne skipIf;
mov( j, edx );
add( 5, edx );
mov( edx, i );
skipIf:

若表达式为真，CPU 无需执行控制转移语句。虽会多执行一条 mov 指令，但比 jmp 指令执行快。

3. 强制 if 语句进行完全布尔求值

完全布尔求值和短路布尔求值可能产生不同结果，有时需确保代码使用特定的求值方式。

使用临时变量
通用方法是计算表达式的每个子组件，将子结果存储到临时变量，然后组合临时结果得到完整结果。例如 Pascal 代码：

if( i < g(y) and k > f(x) ) then begin
    i := 0;
end;

因 Pascal 不保证完全布尔求值，函数 f 可能不被调用。可改写为：

lexpr := i < g(y);
rexpr := k > f(x);
if( lexpr AND rexpr ) then begin
    i := 0;
end;

编译器会将临时变量的值放入寄存器，不必担心效率损失。

C 语言使用位运算符
在 C 语言中，位运算符不支持短路布尔求值。若布尔表达式的子表达式结果为 0 或 1，位运算符（& 和 |）与逻辑运算符（&& 和 ||）结果相同。例如：

#include <stdio.h>
static int i;
static int k;
extern int x;
extern int y;
extern int f( int );
extern int g( int );
int main( void )
{
    if(( i < g(y)) & k > f(x) )
    {
        printf( "Hello" );
    }
    return( 0 );
}

使用位运算符的代码与使用临时变量的代码效果相当，且原 C 源文件更简洁。但要注意，C 的位运算符仅在操作数为 0 和 1 时与逻辑运算符结果相同，可使用 !!(expr) 将零/非零逻辑值转换为 0 或 1。例如：

#include <stdlib.h>
#include <math.h>
#include <stdio.h>
int main( int argc, char **argv )
{
    int boolResult;
    boolResult = !!argc;
    printf( "!!(argc) = %d\n", boolResult );
    return 0;
}

其 80x86 汇编代码仅需三条机器指令将“零/非零”转换为 0/1。

4. 强制 if 语句进行短路布尔求值

短路布尔求值的需求可能更常见。

AND 运算符的短路求值模拟
以 Pascal 语句为例：

if( ptrVar <> NIL AND ptrVar^ < 0 ) then begin
    ptrVar^ := 0;
end;

Pascal 语言未明确规定使用完全布尔求值还是短路求值，为确保正确执行，可改写为：

if( ptrVar <> NIL ) then begin
    if( ptrVar^ < 0 ) then begin
        ptrVar^ := 0;
    end;
end;

此方法虽使源文件稍显杂乱，但能保证短路求值。

OR 运算符的短路求值模拟
对于 C 代码：

#include <stdio.h>
static int i;
static int k;
extern int x;
extern int y;
extern int f( int );
extern int g( int );
int main( void )
{
    if( i < g(y) || k > f(x) )
    {
        printf( "Hello" );
    }
    return( 0 );
}

可手动实现短路求值：

#include <stdio.h>
static int i;
static int k;
extern int x;
extern int y;
extern int f( int );
extern int g( int );
int main( void )
{
    int temp;
    temp = i < g(y);
    if( !temp )
    {
        temp = k > f(x);
    }
    if( temp )
    {
        printf( "Hello" );
    }
    return( 0 );
}

手动强制短路求值的代码效率可能不如编译器直接支持的情况，但能确保程序语义正确。若对速度、代码大小和短路求值都有要求，可牺牲一定的可读性和可维护性，对代码进行解构。例如：

#include <stdio.h>
static int i;
static int k;
extern int x;
extern int y;
extern int f( int );
extern int g( int );
int main( void )
{
    if( i < g(y)) goto IntoIF;
    if( k > f(x) )
    {
      IntoIF:
        printf( "Hello" );
    }
    return( 0 );
}

此代码与依赖编译器短路求值的代码效率相当，说明在某些特殊情况下，解构代码可提高效率。

以下是简单 if 语句执行流程的 mermaid 流程图：

graph TD;
    A[开始] --> B{条件判断};
    B -- 条件为真 --> C[执行语句体];
    B -- 条件为假 --> D[跳过语句体];
    C --> E[结束];
    D --> E;

总结来说，理解 if 语句的编译原理、优化方法以及布尔求值的控制方式，能帮助我们编写更高效、更健壮的代码。在实际编程中，需根据具体情况权衡代码的效率、可读性和可维护性。

《if 语句的原理、优化与布尔求值控制》

5. if 语句相关知识总结与对比

为了更清晰地理解 if 语句不同形式及布尔求值方式的特点，下面通过表格进行总结对比：
| 类型 | 特点 | 示例代码 | 优点 | 缺点 |
| — | — | — | — | — |
| 简单 if 语句 | 比较两个值，条件为真执行语句体 | pascal if( EAX = EBX ) then begin writeln( "EAX is equal to EBX" ); i := i + 1; end; | 逻辑简单，实现直接 | 功能相对单一 |
| if..then..else 语句 | 条件为真执行 then 部分，为假执行 else 部分 | c if( EAX == EBX ) { printf( "EAX is equal to EBX\n" ); ++i; } else { printf( "EAX is not equal to EBX\n" ); } | 可处理两种不同情况 | 存在控制转移，影响效率 |
| 含 elseif 子句的 if 语句 | 可依次判断多个条件 | hla if( EAX = EBX ) then stdout.put( "EAX is equal to EBX" nl ); inc( i ); elseif( EAX = ECX ) then stdout.put( "EAX is equal to ECX" nl ); else stdout.put( "EAX is not equal to EBX or ECX" nl); endif; | 能处理多种条件分支 | 代码复杂度增加 |
| 完全布尔求值 | 确保表达式各子组件都被计算 | pascal lexpr := i < g(y); rexpr := k > f(x); if( lexpr AND rexpr ) then begin i := 0; end; | 保证所有函数调用和副作用都发生 | 可能增加临时变量和计算量 |
| 短路布尔求值 | 当能确定表达式结果时，停止后续子组件计算 | c if( i < g(y) || k > f(x) ) { printf( "Hello" ); } | 减少不必要的计算 | 依赖语言特性或手动实现 |

6. 实际应用中的考虑因素

在实际编程中，使用 if 语句时需要综合考虑多个因素，以下是一些建议：
- 性能优先场景 ：如果代码的性能是关键因素，可根据条件的可能性调整 if..else 语句的顺序，减少控制转移指令。例如，当某个条件大概率为真时，让代码在该条件下直接执行，避免分支操作。同时，可采用强制布尔求值的优化方法，如使用临时变量或位运算符，提高代码执行效率。
- 代码可读性和可维护性优先场景 ：在大多数情况下，代码的可读性和可维护性更为重要。应尽量避免使用过多的 goto 语句和复杂的代码解构，以免产生难以理解和维护的“ spaghetti code”。遵循结构化编程原则，使用清晰的逻辑和注释，让代码易于理解和修改。
- 函数副作用场景 ：当函数调用存在副作用时，需要特别注意布尔求值方式。如果应用逻辑依赖于函数的副作用，必须确保使用完全布尔求值，可通过计算子表达式并存储结果到临时变量的方法实现。

7. 代码优化的操作步骤总结

为了帮助大家更好地进行 if 语句的代码优化，下面总结了具体的操作步骤：
1. 分析条件可能性 ：确定布尔表达式中哪种结果更可能出现，若一种结果明显更常见，可调整 if..else 语句的顺序，使常见情况直接执行，减少分支。
2. 减少控制转移指令 ：对于一些常见的 if 语句，尝试通过调整代码逻辑，减少控制转移指令的使用。例如，先给变量赋默认值，再根据条件进行修改，避免不必要的分支操作。
3. 选择合适的布尔求值方式 ：根据应用需求，判断是否需要强制完全布尔求值或短路布尔求值。若需要完全布尔求值，可使用临时变量或位运算符；若需要短路布尔求值，可通过嵌套 if 语句或手动实现逻辑。
4. 权衡代码质量 ：在优化代码时，要综合考虑代码的性能、可读性和可维护性。避免过度优化导致代码难以理解和维护，确保优化后的代码在满足性能要求的同时，仍具有良好的可读性和可维护性。

以下是 if..then..else 语句执行流程的 mermaid 流程图：

graph TD;
    A[开始] --> B{条件判断};
    B -- 条件为真 --> C[执行 then 部分];
    B -- 条件为假 --> D[执行 else 部分];
    C --> E[结束];
    D --> E;

总之，if 语句是编程中常用的控制结构，掌握其原理、优化方法和布尔求值控制方式，对于编写高效、健壮的代码至关重要。在实际应用中，要根据具体情况灵活运用这些知识，在性能、可读性和可维护性之间找到平衡。