strlen PK sizeof

本文探讨了C/C++中strlen和sizeof函数在计算字符串长度和数组大小上的差异,强调了常量字符串和字符数组的区别,以及为何在处理字符数组时推荐使用sizeof。同时提到了数组退化为指针的问题及其解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

写这篇文章,其实就是复习字符串和数组的差异吧,以及strlen和sizeof的用法,一不注意,还是有很多坑的

差异

strlen 是标准库函数,一般用于计算字符串的长度,运行时计算

sizeof是关键字,用于计算类型的大小,编译时计算

const char* str = "abcd3";
strlen(str) // 5     字符串的长度,5个字符
sizeof(str) // 4或8  即指针的大小 == sizeof(char*)
C/C++对字符串的约定

如果我们将一个字符串赋值给const char* 或者char []或者char*时,编译期会在末尾加上空字符'\0'来表示字符串的中止.

const char* ptr = "abc";  在内存中实际是a b c \0
char ptr[] = "abc";       同上会有空字符

char* ptr = "abc" 不推荐这么做,abc是常量字符串,不同的编译期可能会报错.

这么做的目的是什么了?

因为一些函数,比如strlen,strcmp,printf等遇到\0才会结束 .空字符不计入长度或输出

常量字符串 : const char*

常量字符串会以空字符'\0'表示结束.

对于strlen这个函数,已经知道它是计算长度,那么,他是怎么获取长度了 ?

其实,它是一直计算长度,直到遇到'\0'这个字符,停止计算.

const char* str = "abcd";
strlen(str)  // 4  常量字符串会以'\0'字符表示该字符串的末尾

const char* str1 = "ab\0cd"
strlen(str1)  //2  遇到'\0'字符停止计算
非常量字符串(字符数组) : char* &char []

对于字符数组, 使用strlen 一不注意,就会出现许多问题.

char str[] = {'a', 'b', 'c'};
sizeof(str)  // 3  用于计算类型的大小,即str[3]的大小

strlen(str)  // 4 & 6 & 9等待输出大于等于3的数字 为什么 ???

上面以及说过,strlen会累计长度,知道出现空字符'\0',则停止计算, 为什么会完整且正确的输出cosnt char* 的内容了,那是因为末尾有'\0'表示结束.

为什么字符数组会出现问题了,那是因为,字符数组不会在末尾以空字符'\0'表示结束,函数strlen底层会一直计算,直到在内存中出现空字符'\0'才会结束.

所以对一个字符数组或者其他类型的数组,我们则需要使用sizeof来计算他的大小或者长度.

strlen就不能计算吗? 那肯定可以,只不过需要进行处理啦

char str[5] = {'a','b','c','d','\0'};
strlen(str)  //4  但是str是长度为5的字符串,使用的时候需要+1哦

//特殊情况,中间包含空字符
char str1[4] = {'a','\0','b','c'};
strlen(str1)  //1  因为遇到\0就会停止计算长度
//如果要对这个字符串进行操作,但是我们得到的长度不是实际的长度,会出现问题哦

使用,在计算字符数组的时候,尽量使用sizeof来计算.

总结: strlen是函数,运行时计算,会有函数调用的开销,通常计算长度.

         sizeof是关键字,在编译期计算,没有运行开销,通常用于计算类型的大小

        1 > 对于常量字符串大小的计算,可以使用strlen函数和sizeof关键字

        2 >对于字符数组的计算,则最好使用sizeof关键字.strlen则需要小心使用.

补充:

 Q:为什么我们在开辟malloc一块字符数组空间的时候,经常调用 memset函数进行全部'\0'操作了?

 A:因为使用计算长度的strlen函数,printf函数遇到'\0'字符才会中止.防止内存越界.

         printf函数也是遇到'\0'字符才会结束哦.

前面提到字符数组,在来小谈一会.

字符数组到字符指针的过程,是退化,即前者退化为了后者,为什么这么说, 因为字符数组存储的信息,是比字符指针的信息多的,什么时候发生退化,函数传参的时候就会发生

int len(char* str) {
    //对指针进行操作
    return 0;
}

int main() {
    char str[5] = {'a','b',c'','d', '\0'};
    len(str)  //这里就会发生退化,数组变成了指针传给函数的形参
}

Q:当退化成了指针了,还可以使用sizoef关键字来计算长度了嘛 ?

A: NO,不可以了,此时对指针进行sizeof(str)则是指针的大小,32位是4字节,64位是8字节.

所以,这么防止数组退化为指针了 ???

在C++中,有个叫引用的玩意,和指针很想,但也有差别,什么是引用了?其实就是别名.

int len(char (&str)[5]) { // 引用一个str[5]的对象 防止退化
    //此时的str仍然是数组
    sizeof(str) // 5 表示是一个长度为5的字符数组
    return 0;
}

上面这个方法,有一个缺点就是,形参的长度必须和实参的长度一样,不然就报错,可用性非常低.

其他解决方案:

      1 使用模板,提高可用性,形参的参数大小由模板参数来控制.

      2.使用C++提供的array类

Q: C/C++为什么会数组退化为指针.

A: 1 C/C++不允许使用一个数组直接初始化另外一个数组, 就无法直接数组传参

     2 函数的参数位于栈上,栈空间小,如果数组很大,则会发生爆栈,使用需要退化为指针来传参.

### C语言 `strlen` `sizeof` 的区别与正确用法 #### 基本概念 - **`strlen`**: 是标准库 `<string.h>` 中的一个函数,用来计算字符串的实际长度(即有效字符的数量),返回值为无符号整数类型 (`size_t`)。它不会计入字符串结束符 `\0` 的长度[^2]。 - **`sizeof`**: 是一个操作符而非函数,用于获取变量、数据类型或表达式的存储空间大小,单位为字节 (bytes)[^1]。 --- #### 使用场景对比 ##### 1. 计算数组的总内存占用 对于数组而言,`sizeof` 可以直接得到其分配的空间大小(包括未初始化的部分)。例如: ```c int arr1[10]; printf("Size of arr1: %zu bytes\n", sizeof(arr1)); ``` 上述代码输出结果为 `40` 字节(假设 `int` 占 4 字节),因为 `arr1` 数组总共占据 10 * 4 = 40 字节的内存空间。 注意:如果传递给函数的是数组名,则该数组会退化为指针,此时 `sizeof` 得到的是指针本身的大小而不是原数组的真实尺寸。 ##### 2. 获取字符串的有效长度 针对字符串常量或以零结尾的字符数组,可以使用 `strlen` 来统计实际包含多少个可读字符(不含终止符 `\0`): ```c char str[] = "hello"; printf("Length using strlen: %zu characters\n", strlen(str)); // 输出5 ``` 这里需要注意的是,尽管定义时 `"hello"` 后面隐含了一个额外的空字符作为标记,但它并不被纳入计数范围之内。 而对于仅由单个字符组成的列表形式声明的情况,由于缺乏自动附加的终结标志位,因此无法应用此方法来测量长度: ```c char chars[] = {'a', 'b'}; // 下列语句会产生错误警告,因chars并非严格意义上的C-style string // size_t length = strlen(chars); ``` 另外,在处理动态分配的对象或者复合结构体实例的时候,也需要特别留意两者的适用条件差异。 --- #### 示例代码展示 下面通过一段综合性的例子进一步阐明两者之间的关系及其各自的特性: ```c #include <stdio.h> #include <string.h> int main(void){ char fixedStr[] = "example"; /* 静态分配 */ char dynamicStr[20]; /* 动态预留缓冲区 */ strcpy(dynamicStr,"sample"); printf("Fixed String Size:%lu Bytes\n",(unsigned long)sizeof(fixedStr));//9B incl.\0 printf("Dynamic Buffer Size:%lu Bytes\n",(unsigned long)sizeof(dynamicStr));//20B predef. printf("Content Length Fixed Str:%lu Chars\n",(unsigned long)strlen(fixedStr));//7Ch exclud.\0 printf("Content Length Dynamic Str:%lu Chars\n",(unsigned long)strlen(dynamicStr));//6Ch exclud.\0 return 0; } ``` 运行以上程序片段将会打印如下信息: ``` Fixed String Size:9 Bytes Dynamic Buffer Size:20 Bytes Content Length Fixed Str:7 Chars Content Length Dynamic Str:6 Chars ``` 从中可以看出即使两个字符串的内容几乎相同,但由于它们各自所在的容器容量不同以及是否显式包含了结束标识等因素的影响下,最终呈现出的数据特征也会有所变化。 --- ### 总结说明 综上所述,虽然表面上看去二者似乎都能完成某种类型的度量任务,但实际上它们的作用领域完全不同——前者专注于衡量逻辑上的序列单元数目;后者则侧重于物理层面资源消耗状况评估。所以在日常编码实践中应当依据具体需求合理选用合适的工具手段才是明智之举。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值