PHP垃圾回收机制简单说明

虽然自己也是PHP的学习者,但之前还真没怎么了解PHP内部的垃圾回收流程,只是在我们的代码中用了unset,null,mysql_close,__destruct等等一些函数去释放对象防止内存溢出而已,所以上网GG下,找到了以下一些说明,作下记录“PHP可以自动进行内存管理,清除不再需要的对象。PHP使用了引用计数(reference counting)这种单纯的垃圾回收(garbage collection)机制。每个对象都内含一个引用计数器,每个reference连接到对象,计数器加1。当reference离开生存空间或被设为NULL,计数器减1。当某个对象的引用计数器为零时,PHP知道你将不再需要使用这个对象,释放其所占的内存空间。”

众所周知, PHP 引擎本身是用 C 写的,提到 C 不能不提的就是 GC(垃圾回收).通过 PHP 手册 我们了解到, PHP 引擎会自动进行 GC 动作.那么我们不禁要问,到底它是怎么回收的, & 引用操作是不是指针, unset() 了一个变量时它是不是真的被回收了呢?这些看似手册有提及的问题,如果仔细分析会发现,远没有那么简单泛泛.也许有人会跳出来说:看 PHP 源码不就知道了.是的,等你通读了 PHP 源码后这个问题肯定不在话下了,然本篇要仅从 PHP 本身来分析这些看似平常却被忽视的小细节,当然了,其中难免水平所限,有所疏漏,热烈欢迎广大 phper 来共同讨论.

首先咱先看到例子,最简单不过的执行流程了:
Example 1: gc.php
<?php
error_reporting(E_ALL);
$a = 'I am test.';
$b = & $a;

echo $b ." ";
?>

不用说 % php -f gc.php 输出结果非常明了:
hy0kl% php -f gc.php
I am test.

好,下一个:
Example 2:
<?php
error_reporting(E_ALL);
$a = 'I am test.';
$b = & $a;

$b = 'I will change?';

echo $a ." ";
echo $b ." ";
?>
执行结果依然很明显:
hy0kl% php -f gc.php
I will change?
I will change?

君请看:
Example 3:
<?php
error_reporting(E_ALL);
$a = 'I am test.';
$b = & $a;

unset($a);

echo $a ." ";
echo $b ." ";
?>
是不是得想一下下呢?
hy0kl% php -f gc.php
Notice: Undefined variable: a in /usr/local/www/apache22/data/test/gc.php on line 8
I am test.
有点犯迷糊了吗?

君再看:
Example 4:
<?php
error_reporting(E_ALL);
$a = 'I am test.';
$b = & $a;

unset($b);

echo $a ." ";
echo $b ." ";
?>
其实如果 Example 3 理解了,这个与之异曲同工.
hy0kl% php -f gc.php
I am test.
Notice: Undefined variable: b in /usr/local/www/apache22/data/test/gc.php on line 9

君且看:
Example 5:
<?php
error_reporting(E_ALL);
$a = 'I am test.';
$b = & $a;

$a = null;

echo '$a = '. $a ." ";
echo '$b = '. $b ." ";
?>
猛的第一感觉是什么样的?
hy0kl% php -f gc.php
$a =
$b =
没错,这就是输出结果,对 PHP GC 已有深入理解的 phper 不会觉得有什么奇怪,说实话,当我第一次运行这段代码时很意外,却让我对 PHP GC 有更深刻的理解了.那么下面与之同工的例子自然好理解了.

Example 6:
<?php
error_reporting(E_ALL);
$a = 'I am test.';
$b = & $a;

$b = null;

echo '$a = '. $a ." ";
echo '$b = '. $b ." ";
?>

OK,如果上面的例子的结果对看官来说无任何细节可言,那您可关闭本窗口了,欢迎有空再来!

下面我们来详细分析 GC 与引用.
1. 所有例子中,创建了一个变量,这个过程通俗一点讲:是在内存中开辟了一块空间,在里面存放了一个字符串 I am test. . PHP 内部有个符号表,用来记录各块内存引用计数,那么此时会将这块内存的引用计数 加 1,并且用一个名为 $a 的标签(变量)指向这块内存,方便依标签名来操作内存.

2. 对变量 $a 进行 & 操作,我的理解是找到 $a 所指向的内存,并为 $b 建立同样的一引用指向,并将存放字符串 I am test. 的内存块在符号表中引用计数 加 1.换言之,我们的脚本执行到这一行的时候,存放字符串 I am test. 的那块内存被引用了两次.这里要强调的是, & 操作是建立了引用指向,而不是指针, PHP 没有指针的概念!同时有人提出说类似于 UNIX 的文件软链接.可以在一定程度上这么理解: 存放字符 I am test. 的那块内存是我们的一个真实的文件,而变量 $a 与 $b 是针对真实文件建立的软链接,但它们指向的是同一个真实文件. So, 我们看到,在 Example 2 中给 $b 赋值的同时, $a 的值也跟着变化了.与通过某一软链操作了文件类似.

3. 在 Example 3 与 4 中,进行了 unset() 操作.根据实际的执行结果,可以看出: unset() 只是断开这个变量对它原先指向的内存的引用,使变量本身成为没有定义过空引用,所在调用时发出了 Notice ,并且使那块内存在符号表中引用计数 减 1,并没有影响到其他指向这块内存的变量.换言之,只有当一块内存在符号表中的引用计数为 0 时, PHP 引擎才会将这块内存回收.
PHP 手册
4.0.0 unset() became an expression. (In PHP 3, unset() would always return 1).
这意味着什么?
看看下面的代码与其结果:
<?php
error_reporting(E_ALL);
$a = 'I am test.';
$b = & $a;

unset($a);
unset($a);
unset($a);

echo '$a = '. $a ." ";
echo '$b = '. $b ." ";
?>
hy0kl% php -f gc.php

Notice: Undefined variable: a in /usr/local/www/apache22/data/test/gc.php on line 10
$a =
$b = I am test.
第一次 unset() 的操作已经断开了指向,所以后继的操作不会对符号表的任何内存的引用记数造成影响了.

4. 通过 Example 5 & 6 可以明确无误得出: 赋值 null 操作是相当猛的,它会直接将变量所指向的内存在符号号中的引用计数置 0, 那这块内存自然被引擎回收了,至于何时被再次利用不得而知,有可能马上被用作存储别的信息,也许再也没有使用过.但是无论如何,原来所有指向那块内存变量都将无法再操作被回收的内存了,任何试图调用它的变量都将返回 null.

<?php
error_reporting(E_ALL);
$a = 'I am test.';
$b = & $a;

$b = null;

echo '$a = '. $a ." ";
echo '$b = '. $b ." ";

if (null === $a)
{
echo '$a is null.';
} else
{
echo 'The type of $a is unknown.';
}
?>
hy0kl% php -f gc.php
$a =
$b =
$a is null.

综上所述,充分说明了为什么我们在看开源产品源码的时候,常看到一些比较大的临时变量,或使用完不再调用的重用信息都会被集中或显示的赋值为 null 了.它相当于 UNIX 中直接将真实文件干掉了,所有指向它的软链接自然成了空链了.


转自:http://www.jb51.net/article/24330.htm


<think>嗯,用户想了解PHP的运行机制原理。首先,我需要回忆一下PHP的基本工作流程。PHP是一种服务器端脚本语言,所以它通常在Web服务器上执行,生成动态网页内容。那PHP是如何从代码变成用户看到的页面的呢? 可能要从请求处理开始讲起。当用户访问一个PHP页面时,服务器接收到请求,然后交给PHP解释器处理。中间是不是有模块或者CGI的过程?比如Apache的mod_php或者Nginx通过FastCGI与PHP-FPM通信?这部分需要解释清楚不同服务器环境下的处理方式差异。 然后,PHP代码是如何被解析和执行的?应该提到Zend引擎,它是PHP的核心,负责将PHP代码转换成抽象语法树(AST),然后生成操作码(opcode),最后执行这些操作码。解释型语言和编译型的区别在这里可能也需要简单提及,比如PHP是解释执行,每次请求都会重新解析,除非用了opcache这样的缓存机制。 接下来,可能需要提到PHP的生命周期。从模块初始化、请求处理到关闭模块的各个阶段。比如每个请求开始时的初始化,执行代码,然后释放资源。还有像常驻进程的PHP-FPM如何管理多个请求,避免每次都要重新初始化的开销。 另外,内存管理也是重要的一环。PHP使用引用计数和垃圾回收机制来自动管理变量内存,避免内存泄漏。这部分可能需要举例说明变量的创建和销毁过程。 还有,PHP与扩展的交互。扩展是如何加载的,比如通过php.ini配置加载的模块,扩展如何挂钩到Zend引擎,提供额外的功能。例如,常见的MySQL扩展或PDO是如何工作的。 用户可能还想知道为什么PHP适合Web开发,比如它的无共享架构,每个请求都是独立的,减少了上下文切换的复杂性。或者像超全局变量$_GET、$_POST的处理流程,请求是如何被解析并注入到这些变量中的。 需要注意的是,用户可能有不同的服务器环境,比如使用Apache还是Nginx,或者不同的PHP版本(如PHP5 vs PHP7/8的性能改进)。可能需要提到SAPI(Server API)的不同,比如CLI模式下的运行机制与Web模式有何不同。 最后,可能还需要简要介绍PHP的优化手段,比如opcode缓存(OPcache)如何提升性能,以及JIT(Just-In-Time编译)在PHP8中的引入,如何进一步加速执行效率。 在组织这些内容的时候,要确保结构清晰,分步骤或分模块讲解,从请求处理开始,到代码解析、执行,再到资源释放和输出结果。同时,避免使用过于专业的术语,或者必要时进行解释,让用户容易理解。需要检查是否有遗漏的关键点,比如安全方面的处理,或者与其他语言如Python、Ruby在运行机制上的对比,不过用户的问题可能不需要这些扩展内容,保持专注在PHP本身。</think>PHP运行机制原理可以拆解为以下几个核心步骤,结合其底层架构进行说明: ### 一、请求处理阶段 1. **Web服务器接收请求** - 当用户发起HTTP请求(如访问`.php`文件)时,Apache/Nginx等服务器通过以下方式处理: - **Apache**:通过`mod_php`模块直接调用PHP解释器 - **Nginx**:通过`FastCGI`协议与`PHP-FPM`进程通信 2. **初始化PHP环境** - 启动`Zend引擎`,加载`php.ini`配置 - 注册预定义常量(如`$_GET`、`$_POST`等超全局变量) ### 二、代码解析与执行 1. **词法分析 & 语法分析** ```php <?php echo "Hello, $name"; ?> ``` - 通过`Re2c`生成词法分析器,将代码拆解为Token序列 - `Bison`生成语法分析器,构建抽象语法树(AST) 2. **生成Opcode** - Zend引擎将AST转换为中间代码(Opcode) - 示例操作码: ``` ZEND_ECHO # 输出指令 ZEND_CONCAT # 字符串拼接 ``` 3. **执行阶段** - Zend虚拟机逐条执行Opcode - 内存管理: - 引用计数跟踪变量 - 循环引用通过垃圾回收(GC)处理 ### 三、扩展机制 1. **模块化架构** - 核心扩展(如`Standard`、`PDO`) - 第三方扩展(如`Redis`、`GD`) - 加载方式: ```ini ; php.ini配置 extension=redis.so ``` 2. **Zend API** - 扩展通过`PHP_MINIT_FUNCTION()`等钩子函数注册功能 - 示例扩展开发接口: ```c PHP_FUNCTION(my_custom_function) { // C语言实现逻辑 } ``` ### 四、生命周期管理 1. **单进程模式** - 典型流程: ``` MINIT -> RINIT -> Execute -> RSHUTDOWN -> MSHUTDOWN ``` - `MINIT`:模块初始化(仅一次) - `RINIT`:请求初始化(每次请求) 2. **PHP-FPM进程管理** - 常驻内存的Master-Worker模型 - 连接池管理: ```bash # 配置文件 pm = dynamic pm.max_children = 50 ``` ### 五、性能优化技术 1. **Opcache加速** - 缓存编译后的Opcode - 配置示例: ```ini opcache.enable=1 opcache.memory_consumption=128 ``` 2. **JIT编译(PHP 8+)** - 将Opcode直接编译为机器码 - 启用方式: ```ini opcache.jit_buffer_size=100M opcache.jit=tracing ``` ### 六、输出处理 1. 结果缓冲区管理 - 通过`ob_start()`开启多级缓冲 - 输出流经过`Content-Type`检测后发送给客户端 ### 关键特性总结 | 特性 | 说明 | |---------------------|-----------------------------| | 弱类型实现 | ZVAL结构体动态管理变量类型 | | 单请求隔离 | 每个请求独立上下文,避免内存泄漏 | | 连接持久化 | 数据库连接可通过`pconnect`复用 | 通过这种机制,PHP实现了高效的Web请求处理,同时保持开发便捷性。新的版本(如PHP8.3)通过JIT编译和属性注解等改进,进一步提升了复杂应用的执行效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值