php对内存的管理机制相当的详尽,它在这一点上更类似与java的垃圾回收机制。而对于c语言或者c++大部分时候都只能由程序员自己把申请的空间释放掉。在php中,由于要应对成千上万的连接,同时这些连接往往还需要保持很长的时间。这并不同于c中程序结束了相应的内存块就会被回收。
所以仅仅依靠程序员在写程序的时候注意内存回收是不够的,php肯定要有一些自己内部的、与连接相关的内存管理机制来保证不发生任何的内存泄露。
在本文中,首先对php的内存机制进行一个介绍:
那些在c语言中的空间函数,比如malloc() free() strdup() realloc() calloc(),php中会有不同的形式。
返还申请的内存:对于程序员来说,每一块申请的内存都应该返还,如果不还就会导致内存泄漏。在那些不要求一直运行的程序中,稍许的内存泄漏在整个进程被杀掉之后就结束了。但是类似于apache这种一直运行的web server,小的内存泄漏最终会导致程序的崩溃。
错误处理的例子:
<span style="font-family:SimSun;">void call_function(const char *fname, int fname_len TSRMLS_DC)
{
zend_function *fe;
char *lcase_fname;
/* PHP function names are case-insensitive to simplify locating them in the function tables all function names are implicitly
* translated to lowercase
*/
lcase_fname = estrndup(fname, fname_len);//创造一个函数名的副本
zend_str_tolower(lcase_fname, fname_len);//都转换成小写,这样的寻找的时候很方便,这应该也是php函数表中进行函数标识的方式。
if (zend_hash_find(EG(function_table),
lcase_fname, fname_len + 1, (void **)&fe) == FAILURE) {?SUCCESS。这个是要在函数表里面寻找待调用的函数。
zend_execute(fe->op_array TSRMLS_CC);
} else {
php_error_docref(NULL TSRMLS_CC, E_ERROR,
"Call to undefined function: %s()", fname); //等同于Trigger_error()
}
efree(lcase_fname);
}</span>
在这个例子中,提供了一个php在调用函数时候的功能。当php调用函数时,需要到函数表也就是function_table中去寻找相应的函数,而在寻找之前要先转换到小写字母,这样在寻找的时候可以提高查找的效率。
- php中的内存管理与操作系统的机制类似,但是对象是针对每一个请求所涉及的内存的。
- 除此之外ZendMM还会控制ini文件里面规定的memory_limit,也就是说一旦每个请求所要求的内存超过了这个memory limit,那么也会申请失败。
- 在图中的最下面看到了它与操作系统相联系的一层。针对操作系统中的标准的内存申请和释放的方法,php中都有对应的函数。这些函数并不是一个简单的替换,它们中包含有特定的信息,在这些信息的帮助下就能够把每个请求所申请的内存块进行标识。这样就能够实现对每个请求的内存区域进行分别的管理。
- 同时在图中看到了一共两种内存请求的方式:persistent和per-request,对于persistent来说差不多跟系统的请求就一样了,也就是说是独立在每一个请求之外的,不会在请求结束之后被回收。但是有时候是否persistent可能要runtime才能知道,所以在这种情况下,需要一个flag来指示这一点。对于是否是persistent,进行内存请求的方式是不一样的。下面给出对应关系:
-
- pemalloc(buffer_len,1) == malloc(buffer_len)
- permalloc(buffer_len,0) == emalloc(buffer_len)这种联系是用宏定义的方式决定的
- #define pemalloc(size,persistent) \
-
-
- ((persistent)?malloc(size):emalloc(size))
- flag=1表示是persistent的,为0表示不是,就跟一般的附属于请求的emalloc一样了。
void *safe_pemalloc(size_t size, size_t count, size_t addtl, char persistent);
* {
* zval *helloval;
* MAKE_STD_ZVAL(helloval);
* ZVAL_STRING(helloval, "Hello World", 1);
* zend_hash_add(EG(active_symbol_table), "a", sizeof("a"),
* &helloval, sizeof(zval*), NULL);
* zend_hash_add(EG(active_symbol_table), "b", sizeof("b"),
* &helloval, sizeof(zval*), NULL);
* }
这段代码首先声明了一个zval变量,再用MAKE_STD_ZVAL进行了初始化,接下来用ZVAL_STRING附了初值。然后对这个变量,给出了两个变量名。第一个是a,第二个是b,毫无疑问,第二个肯定是一个引用。但是这段代码这么写肯定有问题,问题就在于你在用zend_hash_add之后并没有更新相应的引用计数。zend并不知道你多加了这么一个引用,这就导致释放内存的时候可能导致两次释放。所以经过修改之后的正确代码如下:
* {
* zval *helloval;
* MAKE_STD_ZVAL(helloval);
* ZVAL_STRING(helloval, "Hello World", 1);
* zend_hash_add(EG(active_symbol_table), "a", sizeof("a"),
* &helloval, sizeof(zval*), NULL);
* <strong>ZVAL_ADDREF(helloval);</strong>//加上这个之后,就不会有重新释放同一块内存空间这样的错误了
* zend_hash_add(EG(active_symbol_table), "b", sizeof("b"),
* &helloval, sizeof(zval*), NULL);
* }
进行了ZVAL_ADDREF之后,下一次unset变量的时候,会先查看ref_count引用计数,如果=1就释放,如果>1就只是-1,并不进行内存释放。
Copy on Write
<?php
$a = 1;
$b = $a;
$b += 5;
?>
很显然在第二行的时候b声明了一个a的引用,那么在执行完了第三行的代码之后,b增加了,a增不增加呢?很多时候可能并不想增加。所以这个时候当Zend检测到refCount>1之后,就会执行一个变量分离的操作,把原来的一块内存变成两块内存:
zval *get_var_and_separate(char *varname, int varname_len TSRMLS_DC)
{
zval **varval, *varcopy;
if (zend_hash_find(EG(active_symbol_table),
varname, varname_len + 1, (void**)&varval) == FAILURE) {
/*符号表里没找到 */
return NULL;
}
if ((*varval)->refcount < 2) {
/* varname 是唯一的引用,什么也不用做 */
return *varval;
}
/* 否则的话,不是唯一的引用,给zval*做一个副本 */
MAKE_STD_ZVAL(varcopy);
varcopy = *varval;
/* Duplicate any allocated structures within the zval* */
zval_copy_ctor(varcopy); //这一块是怎么拷贝的?mark 应该已经跟varval对应的varname连起来了
/* 把varname的版本删掉,这会减少varval的引用次数 */
zend_hash_del(EG(active_symbol_table), varname, varname_len + 1);
/* 初始化新创造的值的引用次数,然后附给varname变量 */
varcopy->refcount = 1;
varcopy->is_ref = 0;
zend_hash_add(EG(active_symbol_table), varname, varname_len + 1,
&varcopy, sizeof(zval*), NULL);
/* Return the new zval* */
return varcopy;
}
首先看到了两个判断语句,第一个判断语句先在符号表里面看看有没有找到相应的变量,如果没找到也就没必要分离了。第二个判断语句是看输入的变量的引用次数是不是小于2,如果是的话那就说明输入变量*varval是唯一的,也没必要分离。
<?php
$a = 1;//执行完这一句之后,a变量的ref_count是1,is_ref是0
$b = &$a;//这一句之后,变量(zval*)的ref_count是2,然后由于显示的&,is_ref为1
$b += 5;// 这个时候在执行这一句的时候就不会有任何的分离
?>
如果你觉得想要a跟着b一起改变,那没有问题,只要显式的用&符号进行引用声明就可以了。这样的话is_ref标志位就会被置1. 这时候也就没必要进行内存块的分离了。所以在上面的代码中要把第二个if语句的判断更改一下:
if ((*varval)->is_ref || (*varval)->refcount < 2) {
/* varname is the only actual reference,
* or it's a full reference to other variables
* either way: no separating to be done
*/
return *varval;
}
<?php
$a = 1;
$b = $a;
$c = &$a;
?>
既不是copy on write也不是change on wirte,那没办法了,只好分离一下。这里只好b独立出来了: