关于wcslen的一个错觉

本文分析了一段看似正常的代码中存在的BUG,该BUG源于对宽字符串进行写入操作时,未正确计算字符串长度,从而导致数据写入错误。文章强调了在处理宽字符串时,应当使用wcslen函数结合sizeof(wchar_t)来准确获取字符串长度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

不知道大家有没有我这种体验.大家先看看下面这段代码:</P>" T/ [+ ~$ V. ~; p' H4 E0 G
<>int fp=_wopen(L"Hello.dat",O_BINARY | O_CREAT | O_TRUNC | O_RDWR);
if(fp==-1) return;; J; |  c2 c1 V. r
write(fp,L"123中国人",wcslen(L"123中国人"));
close(fp);8 v9 p& F" X5 I$ H, e- G

上面这段代码不知道大家看出什么BUG来了.如果大家看不出毛病也不足为怪,因为这是我们的习惯导致了我们的错误产生.

先让我来分析一下write吧.下面是write的原型:- _- R! V& O7 [$ B
int write( int <I>handle</I>, const void *<I>buffer</I>, unsigned int <I>count</I> );
4 s# o; |" a% h$ y# p4 J% r
参数:6 ^, o% A& C3 J
handle   已打开或已创建的文件句柄) T5 I5 ]* B; B7 X
buffer     待写入的数据
count     待写入的数据大小% }3 m9 V7 i# P7 J
* r( P" t  ?+ i% L: U& g
现在分析为什么上面的那代码有bug,其实主要问题就在一个buffer,和count.
如果我们写入一个Ansi字符串,上面的代码改成相应的形式确实没有错.4 q9 q! u1 s9 O$ _0 p7 n$ j
但如果是写入一个宽字符串,那么上面的代码就不严格.原因就在于count./ ^5 Z" y( e" W! E% `: e

我们首先看一下strlen和wcslen,如果使用strlen,一般情况下,我们直接作为字符串的长度,8 W2 x! `# n0 T' c) g" s
而使用wcslen,你会发现,得出的不是字符串的长度而是字符的个数.
$ a0 z8 T5 i2 m8 A  `( ]
这就是问题的所在.一般情况下.char的长度是1,这是用sizeof(char)运算出来的结果.
len=strlen(str)*sizeof(char);而我们一般情况下,都只用strlen(str)来等价,这就是平时的习惯.; A' Q5 o; f! C' c* g3 }
正是由于这个习惯所引来的问题,这个习惯并不适用于宽字符串.因为wcslen(str)*sizeof(wchar_t)并不等于wcslen(strl).这就是习惯所引起的错误.( A! a# t' x8 l, L# }1 o

说到这里我想大家都明白了.我在这里把这种习惯称之为不良习惯.所以大家以后在计算字符串长度的时候,千万不能简而简之,一定要len=strlen(str)*sizeof(char),len=wcslen(str)*sizeof(wchar_t).
不要再犯这种习惯性的低级错误.(在下就犯了这种错误.大家都可怜我吧!)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值