va_list、va_start、va_arg、va_end的原理与使用

C语言可变参数详解
本文深入探讨了C语言中处理不定数量参数的方法,详细解释了stdarg.h中的宏定义及其实现原理,并提供了示例代码。

   1. 概述 
      由于在C语言中没有函数重载,解决不定数目函数参数问题变得比较麻烦;即使采用C++,如果参数个数不能确定,也很难采用函数重载.对这种情况,有些人采用指针参数来解决问题.下面就c语言中处理不定参数数目的问题进行讨论. 
   2. 定义 
      大家先看几宏. 
      在VC++6.0的include有一个stdarg.h头文件,有如下几个宏定义: 
      #define _INTSIZEOF(n)   ((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) ) 
      #define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) )           //第一个可选参数地址 
      #define va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) ) //下一个参数地址 
      #define va_end(ap)    ( ap = (va_list)0 )                            // 将指针置为无效 
      如果对以上几个宏定义不理解,可以略过,接这看后面的内容. 
   3. 参数在堆栈中分布,位置 
      在进程中,堆栈地址是从高到低分配的.当执行一个函数的时候,将参数列表入栈,压入堆栈的高地址部分,然后入栈函数的返回地址,接着入栈函数的执行代码,这个入栈过程,堆栈地址不断递减,一些黑客就是在堆栈中修改函数返回地址,执行自己的代码来达到执行自己插入的代码段的目的. 
      总之,函数在堆栈中的分布情况是:地址从高到低,依次是:函数参数列表,函数返回地址,函数执行代码段. 
      堆栈中,各个函数的分布情况是倒序的.即最后一个参数在列表中地址最高部分,第一个参数在列表地址的最低部分.参数在堆栈中的分布情况如下: 
      最后一个参数 
      倒数第二个参数 
      ... 
      第一个参数 
      函数返回地址 
      函数代码段 
   4. 示例代码 
      void arg_test(int i, ...); 
      int main(int argc,char *argv[]) 
      { 
      int int_size = _INTSIZEOF(int); 
      printf("int_size=%d\n", int_size); 
      arg_test(0, 4); 
      arg_cnt(4,1,2,3,4); 
      return 0; 
      } 
      void arg_test(int i, ...) 
      { 
      int j=0; 
      va_list arg_ptr; 
      va_start(arg_ptr, i); 
      printf("&i = %p\n", &i);//打印参数i在堆栈中的地址 
      printf("arg_ptr = %p\n", arg_ptr); 
      //打印va_start之后arg_ptr地址, 
      //应该比参数i的地址高sizeof(int)个字节 
      //这时arg_ptr指向下一个参数的地址 
      j=*((int *)arg_ptr); 
      printf("%d %d\n", i, j); 
      j=va_arg(arg_ptr, int); 
      printf("arg_ptr = %p\n", arg_ptr); 
      //打印va_arg后arg_ptr的地址 
      //应该比调用va_arg前高sizeof(int)个字节 
      //这时arg_ptr指向下一个参数的地址 
      va_end(arg_ptr); 
      printf("%d %d\n", i, j); 
      } 
   5. 代码说明: 
      int int_size = _INTSIZEOF(int);得到int类型所占字节数 
      va_start(arg_ptr, i); 得到第一个可变参数地址, 

      根据定义(va_list)&v得到起始参数的地址, 再加上_INTSIZEOF(v) ,就是其实参数下一个参数的地址,即第一个可变参数地址. 
      j=va_arg(arg_ptr, int); 得到第一个参参数的值,并且arg_ptr指针上移一个_INTSIZEOF(int),即指向下一个可变参数的地址. 
      va_end(arg_ptr);置空arg_ptr,即arg_ptr=0; 
      总结:读取可变参数的过程其实就是堆栈中,使用指针,遍历堆栈段中的参数列表,从低地址到高地址一个一个地把参数内容读出来的过程. 
   6. 在编程中应该注意的问题和解决办法 
      虽然可以通过在堆栈中遍历参数列表来读出所有的可变参数,但是由于不知道可变参数有多少个,什么时候应该结束遍历,如果在堆栈中遍历太多,那么很可能读取一些无效的数据. 
      解决办法:a.可以在第一个起始参数中指定参数个数,那么就可以在循环还中读取所有的可变参数;b.定义一个结束标记,在调用函数的时候,在最后一个参数中传递这个标记,这样在遍历可变参数的时候,可以根据这个标记结束可变参数的遍历; 
      下面是一段示例代码: 
      //第一个参数定义可选参数个数,用于循环取初参数内容 
      void arg_cnt(int cnt, ...); 
      int main(int argc,char *argv[]) 
      { 
      int int_size = _INTSIZEOF(int); 
      printf("int_size=%d\n", int_size); 
      arg_cnt(4,1,2,3,4); 
      return 0; 
      } 
      void arg_cnt(int cnt, ...) 
      { 
      int value=0; 
      int i=0; 
      int arg_cnt=cnt; 
      va_list arg_ptr; 
      va_start(arg_ptr, cnt); 
      for(i = 0; i < cnt; i++) 
      { 
        value = va_arg(arg_ptr,int); 
        printf("value%d=%d\n", i+1, value); 
      } 
      } 
      虽然可以根据上面两个办法解决读取参数个数的问题,但是如果参数类型都是不定的,该怎么办,如果不知道参数的类型,即使读到了参数也没有办法进行处理.解决办法:可以自定义一些可能出现的参数类型,这样在可变参数列表中,可以可变参数列表中的那类型,然后根据类型,读取可变参数值,并进行准确地转换.传递参数的时候可以这样传递:参数数目,可变参数类型1,可变参数值1,可变参数类型2,可变参数值2,.... 
      这里给出一个完整的例子: 
      #include <stdio.h> 
      #include <stdarg.h> 
      const int INT_TYPE = 100000; 
      const int STR_TYPE = 100001; 
      const int CHAR_TYPE = 100002; 
      const int LONG_TYPE = 100003; 
      const int FLOAT_TYPE = 100004; 
      const int DOUBLE_TYPE = 100005; 
      //第一个参数定义可选参数个数,用于循环取初参数内容 
      //可变参数采用arg_type,arg_value...的形式传递,以处理不同的可变参数类型 
      void arg_type(int cnt, ...); 
      //第一个参数定义可选参数个数,用于循环取初参数内容 
      void arg_cnt(int cnt, ...); 
      //测试va_start,va_arg的使用方法,函数参数在堆栈中的地址分布情况 
      void arg_test(int i, ...); 
      int main(int argc,char *argv[]) 
      { 
      int int_size = _INTSIZEOF(int); 
      printf("int_size=%d\n", int_size); 
      arg_test(0, 4); 
      arg_cnt(4,1,2,3,4); 
      arg_type(2, INT_TYPE, 222, STR_TYPE, "ok,hello world!"); 
      return 0; 
      } 

void arg_test(int i, ...) 

int j=0; 
va_list arg_ptr; 
va_start(arg_ptr, i); 
printf("&i = %p\n", &i);//打印参数i在堆栈中的地址 
printf("arg_ptr = %p\n", arg_ptr); 
//打印va_start之后arg_ptr地址, 
//应该比参数i的地址高sizeof(int)个字节 
//这时arg_ptr指向下一个参数的地址 
j=*((int *)arg_ptr); 
printf("%d %d\n", i, j); 
j=va_arg(arg_ptr, int); 
printf("arg_ptr = %p\n", arg_ptr); 
//打印va_arg后arg_ptr的地址 
//应该比调用va_arg前高sizeof(int)个字节 
//这时arg_ptr指向下一个参数的地址 
va_end(arg_ptr); 
printf("%d %d\n", i, j); 

void arg_cnt(int cnt, ...) 

int value=0; 
int i=0; 
int arg_cnt=cnt; 
va_list arg_ptr; 
va_start(arg_ptr, cnt); 
for(i = 0; i < cnt; i++) 

value = va_arg(arg_ptr,int); 
printf("value%d=%d\n", i+1, value); 


void arg_type(int cnt, ...) 

int arg_type = 0; 
int int_value=0; 
int i=0; 
int arg_cnt=cnt; 
char *str_value = NULL; 
va_list arg_ptr; 
va_start(arg_ptr, cnt); 
for(i = 0; i < cnt; i++) 

arg_type = va_arg(arg_ptr,int); 
switch(arg_type) 

case INT_TYPE: 
   int_value = va_arg(arg_ptr,int); 
   printf("value%d=%d\n", i+1, int_value); 
   break; 
case STR_TYPE: 
   str_value = va_arg(arg_ptr,char*); 
   printf("value%d=%d\n", i+1, str_value); 
   break; 
default: 
   break; 



以上是我个人的见解,不对的地方希望大家指正,发表看法,我不胜感谢!!! 
来自:http://www.cppblog.com/qiujian5628/archive/2008/01/21/41562.html

下面我们来探讨如何写一个简单的可变参数的C函数.写可变参数的 
C函数要在程序中用到以下这些宏: 
void va_start( va_list arg_ptr, prev_param ); 

type va_arg( va_list arg_ptr, type ); 

void va_end( va_list arg_ptr ); 
va在这里是variable-argument(可变参数)的意思. 
这些宏定义在stdarg.h中,所以用到可变参数的程序应该包含这个 
头文件.下面我们写一个简单的可变参数的函数,改函数至少有一个整数 
参数,第二个参数也是整数,是可选的.函数只是打印这两个参数的值. 
void simple_va_fun(int i, ...) 

va_list arg_ptr; 
int j=0; 

va_start(arg_ptr, i); 
j=va_arg(arg_ptr, int); 
va_end(arg_ptr); 
printf("%d %d\n", i, j); 
return; 

我们可以在我们的头文件中这样声明我们的函数: 
extern void simple_va_fun(int i, ...); 
我们在程序中可以这样调用: 
simple_va_fun(100); 
simple_va_fun(100,200); 
从这个函数的实现可以看到,我们使用可变参数应该有以下步骤: 
1)首先在函数里定义一个va_list型的变量,这里是arg_ptr,这个变 
量是指向参数的指针. 
2)然后用va_start宏初始化变量arg_ptr,这个宏的第二个参数是第 
一个可变参数的前一个参数,是一个固定的参数. 
3)然后用va_arg返回可变的参数,并赋值给整数j. va_arg的第二个 
参数是你要返回的参数的类型,这里是int型. 
4)最后用va_end宏结束可变参数的获取.然后你就可以在函数里使 
用第二个参数了.如果函数有多个可变参数的,依次调用va_arg获 
取各个参数. 
如果我们用下面三种方法调用的话,都是合法的,但结果却不一样: 
1)simple_va_fun(100); 
结果是:100 -123456789(会变的值) 
2)simple_va_fun(100,200); 
结果是:100 200 
3)simple_va_fun(100,200,300); 
结果是:100 200 
我们看到第一种调用有错误,第二种调用正确,第三种调用尽管结果 
正确,但和我们函数最初的设计有冲突.下面一节我们探讨出现这些结果 
的原因和可变参数在编译器中是如何处理的. 

(二)可变参数在编译器中的处理 

我们知道va_start,va_arg,va_end是在stdarg.h中被定义成宏的, 
由于1)硬件平台的不同 2)编译器的不同,所以定义的宏也有所不同,下 
面以VC++中stdarg.h里x86平台的宏定义摘录如下(’\’号表示折行): 

typedef char * va_list; 

#define _INTSIZEOF(n) \ 
((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) ) 

#define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) ) 

#define va_arg(ap,t) \ 
( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) ) 

#define va_end(ap) ( ap = (va_list)0 ) 

定义_INTSIZEOF(n)主要是为了某些需要内存的对齐的系统.C语言的函 
数是从右向左压入堆栈的,图(1)是函数的参数在堆栈中的分布位置.我 
们看到va_list被定义成char*,有一些平台或操作系统定义为void*.再 
看va_start的定义,定义为&v+_INTSIZEOF(v),而&v是固定参数在堆栈的 
地址,所以我们运行va_start(ap, v)以后,ap指向第一个可变参数在堆 
栈的地址,如图: 

高地址|-----------------------------| 
|函数返回地址 | 
|-----------------------------| 
|....... | 
|-----------------------------| 
|第n个参数(第一个可变参数) | 
|-----------------------------|<--va_start后ap指向 
|第n-1个参数(最后一个固定参数)| 
低地址|-----------------------------|<-- &v 
图( 1 ) 

然后,我们用va_arg()取得类型t的可变参数值,以上例为int型为例,我 
们看一下va_arg取int型的返回值: 
j= ( *(int*)((ap += _INTSIZEOF(int))-_INTSIZEOF(int)) ); 
首先ap+=sizeof(int),已经指向下一个参数的地址了.然后返回 
ap-sizeof(int)的int*指针,这正是第一个可变参数在堆栈里的地址 
(图2).然后用*取得这个地址的内容(参数值)赋给j. 

高地址|-----------------------------| 
|函数返回地址 | 
|-----------------------------| 
|....... | 
|-----------------------------|<--va_arg后ap指向 
|第n个参数(第一个可变参数) | 
|-----------------------------|<--va_start后ap指向 
|第n-1个参数(最后一个固定参数)| 
低地址|-----------------------------|<-- &v 
图( 2 ) 

最后要说的是va_end宏的意思,x86平台定义为ap=(char*)0;使ap不再 
指向堆栈,而是跟NULL一样.有些直接定义为((void*)0),这样编译器不 
会为va_end产生代码,例如gcc在linux的x86平台就是这样定义的. 
在这里大家要注意一个问题:由于参数的地址用于va_start宏,所 
以参数不能声明为寄存器变量或作为函数或数组类型. 
关于va_start, va_arg, va_end的描述就是这些了,我们要注意的 
是不同的操作系统和硬件平台的定义有些不同,但原理却是相似的. 

(三)可变参数在编程中要注意的问题 

因为va_start, va_arg, va_end等定义成宏,所以它显得很愚蠢, 
可变参数的类型和个数完全在该函数中由程序代码控制,它并不能智能 
地识别不同参数的个数和类型. 
有人会问:那么printf中不是实现了智能识别参数吗?那是因为函数 
printf是从固定参数format字符串来分析出参数的类型,再调用va_arg 
的来获取可变参数的.也就是说,你想实现智能识别可变参数的话是要通 
过在自己的程序里作判断来实现的. 
另外有一个问题,因为编译器对可变参数的函数的原型检查不够严 
格,对编程查错不利.如果simple_va_fun()改为: 
void simple_va_fun(int i, ...) 

va_list arg_ptr; 
char *s=NULL; 

va_start(arg_ptr, i); 
s=va_arg(arg_ptr, char*); 
va_end(arg_ptr); 
printf("%d %s\n", i, s); 
return; 

可变参数为char*型,当我们忘记用两个参数来调用该函数时,就会出现 
core dump(Unix) 或者页面非法的错误(window平台).但也有可能不出 
错,但错误却是难以发现,不利于我们写出高质量的程序. 
以下提一下va系列宏的兼容性. 
System V Unix把va_start定义为只有一个参数的宏: 
va_start(va_list arg_ptr); 
而ANSI C则定义为: 
va_start(va_list arg_ptr, prev_param); 
如果我们要用system V的定义,应该用vararg.h头文件中所定义的 
宏,ANSI C的宏跟system V的宏是不兼容的,我们一般都用ANSI C,所以 
用ANSI C的定义就够了,也便于程序的移植.

va_list-----申请资源

va_start---将资源初始化

va_arg----得到资源里的变量值

va_end----释放资源

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值