一、字符串
实际上C语言中实际上是没有内置的字符串类型的,大部分字符串都是以字符型数组和常量字符串的形式存在的。
字符串可以通过多种方式在C语言中声明和初始化:
直接初始化:
char greeting[] = "Hello, world!";
在这个例子中,greeting
是一个字符数组,自动计算所需的大小以容纳字符串"Hello, world!"
及其结尾的空字符\0
。
指定数组大小:
char buffer[50] = "Hello";
这里,buffer
是一个大小为50的字符数组,初始化时只有前5个字符被设置为"Hello"
,第6个字符为空字符\0
,其余字符因不完全初始化而初始化为\0。
指针指向字符串字面量:
const char *message = "Hello, world!";
message
是一个指向字符的指针,指向字符串字面量"Hello, world!"
的首字符。注意,字符串字面量存储在程序的只读部分,因此通过指针修改字符串内容可能会导致未定义行为。
二、字符串相关函数
C语言的库中提供了很多字符串处理函数:
1、strlen
函数原型:
以 \0 为终止标志,计算并返回字符串的长度,不包括终止的空字符。传的字符串必须有\0,当且仅当以\0结尾时会返回正确的字符串的长度。
#include <stdio.h>
#include <string.h>
int main()
{
char str[20] = "Hello";
int len = strlen(str);
printf("%zu\n", len);
return 0;
}
运行结果:
对于其返回值类型 size_t 是 usigned int 的别名,是一种无符整形,这里有一个点要注意:
下面程序的运行结果:
#include <stdio.h>
#include <string.h>
int main()
{
if (strlen("abc") - strlen("abcdef") > 0)
{
printf(">\n");
}
else
{
printf("<\n");
}
return 0;
}
这里凭直觉判断,3 - 6 = -3 应当小于零,应该返回 < 啊,可是运行结果是:
为什么呢?就是因为这里的 strlen 的返回值是无符整形,所以这里经过运算后,结果是 -3 ,但是实际上:
对于4294967293是大于零的,所以会打印 > 。
2、strcpy
函数的原型:
将
strSourse
指向的字符串复制到 strDestination
指向的位置,遇到\0就会停止,包括终止的空字符。strDestination
必须有足够的空间(而且这里的目标空间必须是可改动的)来接收复制的字符。传的 Sourse 字符串必须有\0,当且仅当以\0结尾时会拷贝正确的字符串到 Destination 中。
#include <stdio.h>
#include <string.h>
int main()
{
char buffer[20] = { 0 };
strcpy(buffer, "zhangsan");
printf("%s\n", buffer);
return 0;
}
运行结果:
模拟这个函数的构成:
#include <stdio.h>
#include <assert.h>
char* my_strcpy(char* strDestination, const char* strSourse)
{
assert(strDestination);
assert(strSourse);
char* retValue = strDestination;
while (*strSourse != '\0')
{
*strDestination++ = *strSourse++;
}
*strDestination = '\0';
return retValue;
}
int main()
{
char buffer[20] = { 0 };
printf("%s\n", my_strcpy(buffer, "zhangsan"));
return 0;
}
运行结果:
3、strcat
在C语言中,strcat
是一个标准的库函数,该名称是 "string concatenate" 的缩写,意为“字符串连接”。strcat
函数的功能是将一个字符串(source string)连接(append)到另一个字符串(destination string)的末尾。完成操作后,目标字符串将包含连接后的新字符串,而源字符串保持不变。
函数原型:
strDestination
:目标字符串数组的指针,它应该有足够的空间来容纳连接后的结果。
strSourse
:源字符串的指针,该字符串将被连接到目标字符串的末尾。
使用 strcat
函数时,必须确保目标字符串数组有足够的空间来存放两个字符串连接后的结果,以及额外的空字符(null terminator)'\0'
,这是C字符串的结束标记。 如果目标数组没有足够的空间,可能会导致缓冲区溢出,这是常见的安全问题。而且目标字符数组需要可改动,而且源字符串要有\0,只有源字符串以\0结尾时可以正常链接。连接时会把目标字符串的\0覆盖,以使字符串可以被完整访问。
#include <stdio.h>
#include <string.h>
int main()
{
char buffer[20] = "Hello ";
//append the string "World!" to the string "Hello " in buffer
strcat(buffer, "World!");
printf("%s\n", buffer);
return 0;
}
模拟实现该函数:
#include <stdio.h>
#include <assert.h>
char* my_strcat(char* strDestination, const char* strSourse)
{
assert(strDestination);
assert(strSourse);
char* retValue = strDestination;
while (*strDestination != '\0')
{
strDestination++;
}
while (*strSourse != '\0')
{
*strDestination++ = *strSourse++;
}
*strDestination = '\0';
return retValue;
}
int main()
{
char buffer[20] = "Hello ";
//append the string "World!" to buffer
printf("%s\n", my_strcat(buffer, "World!"));
return 0;
}
运行结果:
4、strcmp
在C语言中,strcmp
是 "string compare" 的缩写,它的功能是比较两个字符串。strcmp
函数按字典顺序比较两个字符串,并返回一个整数来表示这两个字符串的相对顺序。
函数原型:
string1
:指向第一个要进行比较的以 \0 结尾的字符串的指针。
s