探究printf

本文深入探讨了printf函数的工作原理,通过示例和汇编代码分析了参数传递和可变参数的处理方式。讨论了printf在多线程环境中的线程安全性和不可重入性问题,并提醒了在使用printf时需要注意的类型匹配问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

对printf的探究始于几个问题
1、
short a, b;
printf(“a=%d b=%d”, a, b);
%d是用来打印有符号整型int类型,那它这样打印会不会有问题,比如寻址越界,但是发现其实都能够打印正常,所以应该不会有寻址越界问题。
%c打印出的是ASCII码,字符‘8’,十进制是56
unsigned char a = 56;
printf(“a=%c %d”, a, a);
打印结果: 8 56

2、printf的实现原理究竟是怎样的,它是如何实现可变参数的。
现在我们仍然采用汇编语言以及阅读printf源码来解决疑问。
typedef struct Array{
short a;
short b;
short c;
short d;
char e[10];
};

int mani()
{
Array s = {10, 8, 9, 7, 11,12, 13, 14,15,16, 17, 18, 19, 20};
printf(“s.a=%c s.b=%c s.c=%c s.d=%c s.e[%c %c %c %c %c %c %c %c %c %c]”,
s.a, a.b, s.c, s.d, s.e[0], s.e[1], s.e[2], s.e[3], s.e[4], s.e[5], s.e[6], s.e[7], s.e[8], s.e[9]);
}
汇编语言的核心部分:
初始化Array s
movw 10,80(movw8, -78(%rbp)
movw 9,76(movw7, -74(%rbp)
movb 11,72(movb12, -71(%rbp)
….
movb $20, -63(%rbp)
将printf的入参压入栈
movzbl -63(%rbp), %eax
movsbl %al, %r13d
movzbl -62(%rbp), %eax
movsbl %al, %r12d
….
movzwl -80(%rbp), %eax
movl %r13d, 64(%rsp)
movl %r12d, 56(%rsp)
movl %r11d, 48(%rsp)
….
call printf
通过上述汇编语言,我们可以巩固一下很多知识点
1)函数的入参是从右到左入栈的,也就是说第一个参数离着被调用函数最近
2)之所以将十几个参数传入printf,是为了查看入栈的过程,不然几个参数的话都会被放入寄存器中,就不会观察到上面所说是否有越界访问的问题
3)虽然是字符类型,但是入参在栈中是占用8个字节,short、int类型亦是如此,所以根本不会存在越界访问的问题,唯一存在的问题有,%u打印有符号或者有符号打印%u,存在错误,还有就是%s打印字符串时,如果误传入整型,造成程序崩溃
接下来我们看一下Printf的源码
printf的一种实现(libc下printf.c)
int printf(const char *fmt, …)
{
int ret;
va_list ap;
va_start(ap, fmt); //ap指向了第二个入参地址
ret = vfprintf(stdout, fmt, ap);
va_end(ap);
return ret;
}
va_list、va_start的宏定义 #define _INTSIZEOF(n) \ ((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) ) #define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) ) #define va_arg(ap,t) \ ( (t )((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) ) #define va_end(ap) ( ap = (va_list)0 )
typedef char* va_list;
va_arg宏做了两件事情,第一件事情是先把ap指针指向下一个入参,第二件事情是将ap减去当前入参的大小,重新得到当前入参的位置,强制转换成当前入参。一开始对ap如何指向下一个入参存在疑问。原来是先指向下一个,然后再用临时变量返回。
关于vfprintf,没有继续深究,基本原理应该也是按上面的8字节寻址,知道解析完fmt.

最后贴一个va_list的示例代码:
下面是va_list的用法示例 包含的头文件stdarg.h:
int AveInt(int,…);
void main()
{
printf(“%d/t”,AveInt(2,2,3));
printf(“%d/t”,AveInt(4,2,4,6,8));
return;
}
int AveInt(int v,…)
{
int ReturnValue=0;
int i=v;
va_list ap ;
va_start(ap,v);
while(i>0)
{
ReturnValue+=va_arg(ap,int) ;
i–;
}
va_end(ap);
return ReturnValue/=v;
}
2016/04/21:讲到一个异步信号安全函、可重入函数、线程安全函数,对于printf这类函数,它们使用了全局数据结构(iobuffer),所以不是线程安全的(多个线程同时访问共享资源),也是不可重入的(有共享资源,可能损坏);
一个可重入函数意味着可以被中断,可重入函数与异步信号函数是等价的,是线程安全函数的真子集。

2017/8/25:
工作中遇到一个问题,以为编译器会自动类型转换,其实不是,
我们知道智能指针类对象和指针可以相互赋值,
比如sp p;它其实是对象,内部维护着一个指针
printf(“%p”, p); 我以为可以自动转换成指针,但其实printf的实现可以看出,printf的第一个参数就是一个字符串,和后面的参数没有关联的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值