C进阶_字符串库函数

文章介绍了C语言中几个关键的字符串处理函数,包括strlen用于计算字符串长度,strcpy用于复制字符串,strcat用于字符串拼接,以及strcmp用于比较字符串。文章强调了这些函数的安全性问题,如目标空间大小的限制,以及无符号整型可能导致的比较错误。同时,提供了这些函数的模拟实现和使用示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

求字符串长度

strlen

常规实现

递归实现

指针-指针实现

长度不受限制的字符串函数

strcpy

模拟实现strcpy

strcat

模拟实现strcat

strcmp

模拟实现strcmp 

长度受限制的字符串函数

strncpy

strncat

strncmp

strerror


求字符串长度

strlen

size_t strlen ( const char * str );

字符串已经 '\0' 作为结束标志,strlen函数返回的是在字符串中 '\0' 前面出现的字符个数(不包
含 '\0' )。

参数指向的字符串必须要以 '\0' 结束。

注意函数的返回值为size_t,是无符号的( 易错 )。

学会strlen函数的模拟实现:

常规实现

int my_strlen(const char* str)
{
	assert(str!=NULL);
	int count = 0;
	while (*str != 0)
	{
		count++;
		str++;
	}
	return count;
}

递归实现

int my_strlen(const char* str)
{
	assert(str != NULL);
	if (*str != '\0')
		return 1 + my_strlen(str + 1);
	else
		return 0;
}

指针-指针实现

int my_strlen(const char* str)
{
	const char* start = str;
	assert(str != NULL);
	while (*str)
	{
		str++;
	}
	return str - start;
}

在strlen的文档中,返回类型是size_t

size_t strlen( const char *string );

为什么是size_t?这是因为strlen是求字符长度的,求出的长度是不可能为负数的,而size_t其实就是unsigned int即无符号整型。

但是注意size_t有它的坏处,见下:

int main()
{
	if (strlen("abc") - strlen("abcdef") > 0)
		printf(">");
	else
		printf("<");
	return 0;
}

执行这段代码,结果竟然是>。这是因为3-6虽然是-3,但由于是无符号整型,它就被当成正数了。

长度不受限制的字符串函数

strcpy

char* strcpy(char * destination, const char * source );

Copies the C string pointed by source into the array pointed by destination, including the
terminating null character (and stopping at that point).

源字符串必须以\0结束。

会将源字符串中的\0拷贝到目标空间。

目标空间必须足够大,以确保能存放源字符串。

目标空间必须可变。

为什么源字符串必须以\0结束?如果不以\0结束,编译器就会在内存中持续往后读取字符,直到遇到\0,比如:

int main()
{
	char arr1[100] = {0};
	char arr2[] = { 'h','e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd' };
	strcpy(arr1, arr2);
	printf("%s", arr1);
	return 0;
}

并没有成功返回0。

那什么是会将源字符串中的\0拷贝到目标空间?

int main()
{
	char arr1[100] = {0};
	char arr2[] = { 'h','e', 'l', 'l', '\0', ' ', 'w', 'o', 'r', 'l', 'd' };
	char arr3[] = "hello\0world";
	strcpy(arr1, arr2);
	printf("%s\n", arr1);
	strcpy(arr1, arr3);
	printf("%s\n", arr1);
	return 0;
}

目标空间不够大会怎样?

int main()
{
	char arr1[5] = { 0 };
	char arr2[] = "hello world";
	strcpy(arr1, arr2);
	printf("%s\n", arr1);
	return 0;
}

 

虽然成功打印了,但会报错。

什么是目标空间必须可变?

int main()
{
	char* p = "abcdefghijklm";
	char arr[] = "hello world";
	strcpy(p, arr);
	printf("%s\n", p);
	return 0;
}

可以看到程序崩溃了。这是因为abcdefghijklm是常量字符串,而不是变量。所以要用数组来存放字符串。

模拟实现strcpy

char* my_strcpy(char* dest,const char* src)
{
	char* ret = dest;
	assert(dest&&src);
	while (*dest++ = *src++)
	{
		;
	}
	return ret;
}
int main()
{
	char arr1[30] = "";
	char arr2[] = "hello world";
	my_strcpy(arr1, arr2);
	printf("%s\n", arr1);
	return 0;
}

strcat

请看strcat的文档

Append a string.

char *strcat( char *strDestination, const char *strSource );

Return Value

Each of these functions returns the destination string (strDestination). No return value is reserved to indicate an error.

Parameters

strDestination

Null-terminated destination string

strSource

Null-terminated source string

可以看到函数原型和strcpy的原型几乎一样。

但作用不同,strcat的作用是Append a string即在目标字符串后追加源字符串。

目标空间要有\0,源字符串必须以\0结束。

为什么?假设我要把world追加到hello后边……

编译器先去目标空间中找到\0,从源字符串中,从w开始\0覆盖掉,然后依次把字符传到目标空间,直到遇到\0结束。

不论是目标字符串还是源字符串,都是遇到\0结束。

目标空间必须有足够的大,能容纳下源字符串的内容。

目标空间必须可修改。道理同strcpy。

先来模拟实现下strcat。

模拟实现strcat

char* my_strcat(char* dest, const char* src)
{
	assert(dest && src);
	char* ret = dest;

	//1. 找目标空间的\0
	while (*dest)
	{
		dest++;
	}
	//2. 追加
	while (*dest++ = *src++)
	{
		;
	}
	return ret;
}

字符串自己给自己追加,如何?可能会有问题。

当字符串给自己追加时……比如要将"abcdef"追加给"abcdef",dest会在while循环中找到\0。

之后\0被a覆盖。接着在a后边追加bcdef直到*dest被赋值成\0停止循环。

可是在这里\0已经被覆盖掉了,怎么遇到\0?这就是问题所在

 

strcmp

在MSDN中查阅strcmp的文档:

Remarks

The strcmp function compares string1 and string2 lexicographically and returns a value indicating their relationship.

Return Value

The return value for each of these functions indicates the lexicographic relation of string1 to string2.

ValueRelationship of string1 to string2
< 0string1 less than string2
0string1 identical to string2
> 0string1 greater than string2

可以发现strcmp是按字典序对两个字符串比较大小,当string1小于string2时返回值小于0,当string1等于string2时返回值等于0,当string1大于string2时返回值大于0。

在Visual Studio环境下,是小于的情况返回-1,是等于的情况返回0,是大于的情况返回1。但这并不意味着在所有IDE或编译器下都返回-1、0、1。

现在对abc和abcdef进行比较:

#include <stdio.h>
#include <string.h>
int main()
{
	char arr1[] = "abq";
	char arr2[] = "abcdef";
	int ret = strcmp(arr1,arr2);
	printf("%d", ret);
	return 0;
}

在ASCII码中,q的值大于c,所以返回值为1:

模拟实现strcmp 

#include <assert.h>
int my_strcmp(const char* str1, const char* str2)
{
	assert(str1 && str2);
	while (*str1 == *str2)
	{
		if (*str1 == '\0')
			return 0;
		str1++;
		str2++;
	}
	if (*str1 > *str2)
		return 1;
	else
		return -1;
}

有一种情况是str1和str1大小一样时返回0,所以在进入while循环后就要判断*str1是不是等于\0,如果是就说明两个字符串大小相等,就返回0。

当遇到不同的字符时,while循环会结束,如果*str1大于*str2就返回1,否则,也就是*str小于*str2时返回-1。

刚刚提到:

不意味着在所有IDE或编译器下都返回-1、0、1。

那就来模拟下不是返回-1、0、1的情况:

#include <assert.h>
int my_strcmp(const char* str1, const char* str2)
{
	assert(str1 && str2);
	while (*str1 == *str2)
	{
		if (*str1 == '\0')
			return 0;
		str1++;
		str2++;
	}
	return *str1 - *str2;
}

注意看最后,return *str1-str2;就是直接返回两个字母的ASCII值的差。

虽然C语言有它的标准,但标准并没有具体规定大于和小于的情况返回多少,只规定返回的值是大于0还是小于0。

像strcpy、strcat、strcmp这些函数都是长度不受限制的字符串函数。不受限制也就意味着相对来说不安全,比如刚才演示的strcat,让字符串自己给自己追加,如果没有遇到\0就会陷入死循环。如果限制了长度们就不会陷入死循环。

长度受限制的字符串函数

为了尽可能地提高安全性,后来C语言又引入了一些新的函数,这些函数是长度受限制的字符串函数。这里仅作简单介绍,会用即可~

strncpy

它的函数原型是:

char *strncpy( char *strDest, const char *strSource, size_t count );

作用是:

拷贝num个字符从源字符串到目标空间。

如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。

调试以下代码:

#include <string.h>
#include <stdio.h>
int main()
{
	char arr1[20] = "xxxxxxxxxx";
	strncpy(arr1, "abcdef", 3);
	printf("%s", arr1);
	return 0;
}

 对arr1进行监视,会发现strncpy不会在拷贝后给字符串加上\0。

当拷贝10个字符时:

#include <string.h>
#include <stdio.h>
int main()
{
	char arr1[20] = "xxxxxxxxxx";
	strncpy(arr1, "abcdef", 10);
	printf("%s", arr1);
	return 0;
}

这印证了刚才提到的

如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。

strncat

它的函数原型是:

char *strncat( char *strDest, const char *strSource, size_t count );

查阅strncat的文档可得知

Appends the first num characters of source to destination, plus a terminating null-character.
If the length of the C string in source is less than num, only the content up to the terminating
null-character is copied.

可知在追加后会加上\0。此外如果源字符串的长度小于第三个参数的值,那么只会对源字符的\0之前的字符进行拷贝。

下面调试以下代码: 

#include <string.h>
#include <stdio.h>
int main()
{
	char arr1[20] = "abc";
	strncat(arr1, "abcdef", 4);
	printf("%s", arr1);
	return 0;
}

可以发现abcdef的长度明显大于4,那么只会拷贝前四个字符。

再来调试以下代码:

#include <string.h>
#include <stdio.h>
int main()
{
	char arr1[20] = "abc\0xxxxxx";
	strncat(arr1, "abcdef", 4);
	printf("%s", arr1);
	return 0;
}

可以看到,是从目标字符串的\0开始追加字符,追加四个字符,到最后添加\0。 

在追加后如果打印此字符串,最后的xx就不会被打印了。

strncmp

它的函数原型是:

int strncmp( const char *string1, const char *string2, size_t count );

与strcmp一样,都是按字典序对两个字符串比较大小,当string1小于string2时返回值小于0,当string1等于string2时返回值等于0,当string1大于string2时返回值大于0。

调试以下代码:

#include <string.h>
#include <stdio.h>
int main()
{
	char* p1 = "abcdef";
	char* p2 = "abcqwer";
	int ret = strncmp(p1, p2, 3);
	printf("%s", ret);
	return 0;
}

这是只比较前三个字符,输出结果为:

如果比较前四个字符,调试下边的代码:

#include <string.h>
#include <stdio.h>
int main()
{
	char* p1 = "abcdef";
	char* p2 = "abcqwer";
	int ret = strncmp(p1, p2, 4);
	printf("%s", ret);
	return 0;
}

输出结果为:

这是因为在ASCII中,q的值大于d,所以返回-1。

strerror

它的函数原型为:

char * strerror ( int errnum );

返回错误码,所对应的错误信息。

它的头文件为errno.h。

例子:

#include <stdio.h>
#include <string.h>
#include <errno.h>//必须包含的头文件
int main()
{
FILE* pFile;
pFile = fopen("unexist.ent", "r");
if (pFile == NULL)
printf("Error opening file unexist.ent: %s\n", strerror(errno));
return 0;
}

输出结果为:

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值