常用的字符函数

这是个谜

已于 2023-03-18 20:37:44 修改

阅读量1.5k

点赞数 4

文章标签： c语言

于 2023-03-18 08:52:55 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_63653920/article/details/129631855

版权

文章详细介绍了C语言中几个常用的字符串处理函数，包括strlen用于计算字符串长度，strcpy用于复制字符串，strcat用于连接字符串，strcmp用于比较字符串，strstr用于查找子字符串，strtok用于分割字符串，以及memcpy和memmove用于内存操作。每个函数的使用方法、注意事项和模拟实现都有详尽的解释。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

常用字符函数

字符函数都包含在头文件string.h中，函数的参数都是以字符串为主。

一、strlen函数

函数原型

size_t strlen(const char* str)

str是指向要检测字符串长度的指针。

注意：使用const修饰字符指针str是为了保护字符指针指向的字符串的内容不被破坏。

该函数的作用是返回给定的空终止字符串的长度。其中，空终止字符串就是以’\0’结尾的特殊字符串。

1.1、函数注意事项

str指向的字符串必须以’\0’作为字符串的结束标志。strlen函数返回的是字符串中’\0’第一次出现时，该’\0’前所有字符的个数。
```
#include <stdio.h>
#include <string.h>
int main()
{	
	printf("%zd ", strlen("abcd\0ab\0c"));
	printf("%zd ", strlen("abcdab"));
	return 0;	
}
```
运行结果：

4 6
注意指向的字符必须要以’\0’结束
```
#include <stdio.h>
#include <string.h>

int main()
{
	char str1[] = "abc";
	char str2[] = {'a', 'b', 'c'};
	// 指向的字符以'\0'结束
	printf("%d\n", strlen(str1));
	// 指向的字符没有以'\0'结束
	printf("%d\n", strlen(str2));
	
	return 0;
}
```
运行结果
```
3
随机值
```
解读随机值：strlen函数只有遇到’\0’才停止读取字符。而字符数组str2中没有’\0’，所以在使用strlen函数获取字符数组str2的字符个数时，strlen读取完字符’c’后，继续在内存中读取，直至读取到空终止字符才停止读取。而空终止字符可以出现在内存中的任一位置。因此，strlen(str2)函数的返回值是随机值。下面分别示VScode和visual studio2022的结果。

VScode：

Visual studio：

注意strlen函数的返回值是无符号的

#include <stdio.h>
#include <string.h>
int main()
{
	if (strlen("abc") - strlen("abcdef") > 0)
	{
		printf(">\n");
	}
	else
	{
		printf("<=\n");
	}
    return 0;
}

解析：由于strlen函数的返回值是无符号整型，所以编译器会将3-6的计算结果-3强制类型转换为无符号整型，所以编译器会把-3的补码即1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1101当成一个数进行解读。此时strlen(“abc”) - strlen(“abcdef”)的运算结果是一个很大的数值即4294967293。因此运算结果大于0，执行if语句内的代码块，则打印大于号。

运行结果如下：

>

1.2、模拟实现strlen函数

通过模拟实现一个库函数，进一步掌握库函数的应用。

#include <stdio.h>
#include <assert.h>
// 使用const修饰符保护字符指针指向的内容不被修改
size_t my_strlen(const char *str)
{
    // 使用断言函数判断传递过来的字符指针是否为空指针
    assert(str);
    // 三种实现方法
    // 计算器
    // int count = 0;
    // while (*str++)
    // {
    //     count++;
    // }
    // return (count);

    // // 递归版本：不创建临时变量，求字符长度
    // if (*str)
    // {
    //     return (1 + my_strlen(str + 1));
    // }
    // else
    // {
    //     return 0;
    // }
    // 指针-指针
    char *start = (char *)str;
    while (*str++)
    {
        continue;
    }

    return (str - start - 1);
}
int main()
{
    char arr[] = "bit";
    printf("%d\n", my_strlen(arr));
    return 0;
}

运行结果：

二、strcpy函数

函数原型

char* strcpy(char* dest, const char* src);

函数功能：复制字符指针src所指向的空终止字节字符串，包括空终止字符，到字符指针dest所指向的字符数组中。函数返回的是字符指针dest所指向的字符数组中的首字符地址。

dest：指向要写入的字符串的指针

src：指向要复制的空终止字符串的字符串的指针

2.1、函数注意事项

源字符串必须以’\0’结束。

#include <stdio.h>
#include <string.h>

int main()
{
    // 源字符以'\0'结束
    char str1[20] = "abcd";
    char str2[] = "efgh";
    printf("%s\n", strcpy(str1, str2));
    
    // 源字符没有以'\0'结束
    char str3[20] = "abcd";
    char str4[] = {'e', 'f', 'g', 'h'};
  
    printf("%s\n", strcpy(str3, str4));

    return 0;
}

解读：当源字符没有以空终止字符结束时，strcpy将str4中的字符h拷贝到str3后，继续拷贝内存中的内容，直到strcpy函数在内存中遇到了空终止字符。因为空终止字符在内存中的位置由编译器决定的，所以打印结果是随机的，下面分别展示Visual studio和VS code的运行结果。

Visual studio：

VS code:

会将源字符串中的’\0’拷贝到目标空间，并且直至第一次遇到源字符串中的’\0’就结束拷贝。注意：若源字符串中无空终止字符，将导致拷贝结果不可知，这一点与strlen函数类似。
目标空间必须足够大，以确保能存放源字符。若目标空间较小不足以容纳拷贝过来的字符，否则导致程序崩溃。举个例子
```
#include <stdio.h>
#include <string.h>
int main()
{
	char arr1[] = "abcdef";
	char arr2[1] = {0};
	printf("%s\n", strcpy(arr2, arr1));
	return 0;
}
```

如上图，虽然程序能复制字符串，但是程序崩溃了。

目标空间必须可改，否则此程序崩溃

2.1、模拟实现strcpy函数


#include <stdio.h>
#include <assert.h>
// 返回的是目标空间的起始地址
char* my_strcpy(char* dest, const char* src)
{
	// 使用断言函数，判断传递过来的字符指针是否为空指针
	assert(dest && src);
    // 记录目标空间的起始地址
	char* start = dest;
	while (*dest++ = *src++)
	{
		continue;
	}
	return (start);
}
int main()
{
	char arr1[] = "hehe\n";
	char arr2[21] = { 0 };

	my_strcpy(arr2, arr1);
	printf("%s\n", arr2);
	return 0;
}

运行结果：

三、strcat函数

函数原型

char* strcat(char *dest, const char* src);

函数功能：把src所指向的空终止字符串的副本后附到dest所指向的空终止字符串的末尾。src[0]替换dest末尾的空终止符。

dest：指向需要在末尾后附字符串的空终止字符串的指针，dest一般为该字符串的首字符地址。

src：指向作为复制来源的空终止字符串的指针，src一般为该字符串的首地址

函数返回的是目标空间的起始地址即dest指向的字符串的首字符地址

3.1、注意事项

源字符必须以空终止字符结束，拷贝到源字符串的空终止字符时结束拷贝。从目标空间的空终止字符处开始拷贝。
目标空间必须足够大，能容纳源字符的内容
目标空间必须可修改。否则程序崩溃
strcat函数的两个参数指向相同的字符串，程序陷入死循环。但是在一些编译器中，程序仍然追加成功。举个例子：

函数功能测试

#include <stdio.h>
#include <string.h>
int main()
{
	char str[22] = "abcd";
	char str1[] = "ef";
	// 把ef链接到abcd的后面
	printf("%s\n", strcat(str, str1));
	
	return 0;
}

3.2、strcat函数的模拟实现

#include <stdio.h>
#include <assert.h>
char* my_strcat(char* dest, const char* src)
{
	assert(dest && src);
	char* start = dest;
	// 分析：找到目标空间中的第一个空终止字符
	// 找到目标空间中的空终止字符
	while (*dest)
	{
		dest++;
	}
	// 从目标空间中的第一个空终止字符处开始拷贝
	while (*dest++ = *src++)
	{
		continue;
	}
	// 返回目标空间的起始地址
	return start;	
}
int main()
{
	char str1[20] = "hello ";
	char str2[] = "world";
	printf("%s\n", my_strcat(str1, str2));
		
	return 0;
}

四、strcmp函数

函数原型：

int strcmp(const char* str1, const char* str2)

str1和str2都是指向要比较的空终止字符串。

函数功能测试：

#include <stdio.h>
#include <string.h>

int main()
{
	char* str1 = "abcdef";
	char* str2 = "bbq";
	// 比较的是对应位置上的字符的ASCII码值
	if (strcmp(str1, str2) > 0)
	{
		printf("str1大于str2\n");
	}
	else if (strcmp(str1, str2) < 0)
	{
		printf("str1小于str2\n");
	}
	else
	{
		printf("两个字符串相等\n");
	}
	
	return 0;
}

4.1、注意事项

若 lhs 或 rhs 不是指向空终止字节字符串的指针，则行为未定义。
lhs和rhs必须是以空终止字符结束。

标准规定：

第一个字符大于第二个字符，则返回大于0 的数字
第一个字符小于第二个字符，则返回小于0的数字
第一个字符等于第二个字符，则返回0

4.2、strcmp函数的模拟实现

// 模拟实现strcmp函数
#include <stdio.h>
#include <assert.h>

// 使用const修饰字符指针，保证两个字符指针指向的内容不被修改
int my_strcmp(const char *str1, const char *str2)
{
    assert(str1 && str2);
    while (*str1 == *str2)
    {
        if (*str1 == '\0')
        {
            return 0;
        }
        str1++;
        str2++;
    }
    return (str2 - str1);
}
int main()
{
    char str1[] = "abcdef";
    char str2[] = "abq";
    printf("%d\n", my_strcmp(str1, str2));
    return 0;
}

五、strstr函数

函数原型

char* strstr(const char* str, const char* substr);

函数功能：查找substr所指向的空终止字符串在str所指向的空终止字符串中的首次出现即在一个字符串中查找指定的子字符串，不比较空字符。

返回值：若查找失败，返回空指针；若查找成功，则返回指向substr在str中首次出现的字符的指针

第一个参数str：被查找的字符串，第二个参数substr：要查找的子字符串。

函数功能测试

#include <stdio.h>
#include <string.h>

int main()
{
	char arr1[] = "abcdef";
	char arr2[] = "bcd";
	
	if (NULL == (strstr(arr1, arr2)))
	{
		printf("找不到\n");
	}
	else
	{
		printf("%s\n", strstr(arr1, arr2));
	}
	
	return 0;	
}

类似函数：

strchr:在一个字符串中找某个字符第一次出现的位置，返回的是第一次出现的地址。

strrchr:在一个字符串中找某个字符最后一次出现的位置，返回的是最后一次出现的地址。

在此就不详细介绍这两个函数。可参考C/C++官网https://legacy.cplusplus.com/
或https://en.cppreference.com/w/

5.1、注意事项

在使用strstr函数时，若是第一个或第二个函数为空指针，将导致程序崩溃或出现未定义的行为。因此，在使用该函数前，要判断strstr的两个参数是否为空指针。
strstr函数的两个参数必须以’\0’结尾，否则导致程序出现未可知的结果。

5.2、strcstr函数的模拟实现

#include <stdio.h>
#include <assert.h>

char* my_strstr(const char* str1, const char* str2)
{
	assert(str1 && str2);// 判断两个参数是否空指针
	// 使用s1和s2分别遍历两个字符串
	char* s1 = NULL;
	char* s2 = NULL;
	// 记录上次遍历s1字符串时开始遍历的位置
	char* cp = (char*)str1;
	
	while (*cp)
	{
		s1 = cp;
		s2 = (char*)str2;
		while (*s1 && *s2 && *s1 == *s2)
		{
			s1++;
			s2++;
		}
		// 当*s2为空终止字符时，说明在字符串str1中找到指定的子字符串
		if ('\0' == *s2)
		{
			// 返回字符串str1中首个出现的属于子字符串中的字符的地址
			return cp;
		}
		cp++;
	}
	return NULL;
}
int main()
{
	char str1[20] = "abccdef";
	char str2[] = "ccd";
	
	char* ret = strstr(str1, str2);
	printf("%s\n", ret);
	return 0;
}

六、strtok函数

函数原型：

char* strtok(char* str, const char* delim);

第二个参数delim是分隔符的字符集合。delim是英文单词delimiter的缩写，中文为分隔符。

第一个参数str包含了0个或多个分隔符的字符串

举个简单例子：对于字符串123456@fire.net，规定字符@与. 是分隔符，那么123456、fire以及net都被称为标记（token）。

函数功能讲解：

若str是非空指针，则对strtok函数的调用被当做strtok函数对此特定字符串的首次调用。函数在str指向的字符串中搜索首个不是分隔符的字符。
- 若在str指向的字符串中找不到首个非分隔符，则函数返回空指针
- 若在str指向的字符串中找到非分隔符，则该字符是的开标记始，然后函数从这个字符开始搜索首个分隔符。
  - 若找不到分隔符，则该字符串只有一个标记，将来对strtok函数的调用，就会返回空指针
  - 若找到分隔符，则用字符’\0’替代这个分隔符，并将该分隔符的下一个字符的地址赋值给函数体内的静态变量
- 然后函数返回首次找到的非分隔符的字符的地址
若str是空指针，则把此次对strtok函数的调用当做对strtok函数的后续调用，函数从先前调用中的置零位置的下一个位置开始。

综上，函数的返回值是标记中首字符地址，若找不到标记则返回空指针。

函数功能测试

#include <stdio.h>
#include <string.h>
int main()
{
    char str[] = "a36b@cdt.uef.er";
    char sep[] = "@.";// 分隔符的集合

    for (char* tmp = strtok(str, sep); tmp != NULL; tmp = strtok(NULL, sep))
    {
        printf("%s\n", tmp);
    }

    return 0;
}

6.1、注意事项

若strtok函数的两个参数中的任意一个为空指针或非法指针，则调用该函数时程序崩溃。
两个参数指向的字符串必须以\0结尾。

6.2、strtok函数的模拟实现

#include <stdio.h>
#include <string.h>

char *my_strtok(char *str, const char *delim) 
{
    static char *p = NULL; // 静态变量，用于记录上一次处理完毕的位置
    if (str != NULL) 
    {
        p = str;
    } 
    else if ('\0' == *p)
    { 
        // 已经到达字符串末尾，返回空指针
        return NULL;
    }
    
    char *start = p;
    while ('\0' == *p) 
    {
        const char *q = delim;
        while (*q != '\0' && *q != *p)
        {
            q++;
        }
        if (*q != '\0') 
        { 
            // 当前字符是分隔符，并将当前字符置为空字符
            *p = '\0';
            p++;
            if (start != p - 1) 
            { 
                // 忽略连续分隔符
                return start;
            } 
            else
            {
                start = p;
            }
        } 
        else 
        {
            p++;
        }
    }
    
    return start;
}

int main() {
    char s[] = "Hello,world,,how are you?";
    char *token = my_strtok(s, " ,?");
    while (token != NULL) {
        printf("%s\n", token);
        token = my_strtok(NULL, " ,?");
    }
    return 0;
}

七、memcpy函数

该函数也是定义在stdio.h头文件中的

函数原型

void* memcpy(void* dest, const void* src, size_t count);

函数功能：从src指向的对象中复制count个字符到dest所指向的对象中去。

dest为指向要复制的对象的指针

src为指向复制来源对象的指针

count为要复制的字节数

函数返回值是目标空间的起始地址

函数应用举例

#include <stdio.h>
#include <string.h>

int main()
{
	int src[] = {9, 8, 7, 6, 5, 4, 1, 2, 3};
	int dest[20] = {0};
	
	memcpy(dest, src, 20);
	for (int i = 0; i < 5; i++)
	{
		printf("%d ", dest[i]);
	}
	
	return 0;
}

7.1、函数注意事项

函数memcpy从src的位置开始向后复制count个字节的数据到dest的内存位置。
如果src和dest有任何的重叠，复制的结果都是未定义的。
若dest或src为空指针或是非法指针，则行为未定义。具体的运行结果一般是程序崩溃。
必须保证目标空间的内存足够大，足以容纳count个字节，否则程序崩溃。

7.2、模拟实现

// 模拟实现memcpy函数
#include <stdio.h>
#include <assert.h>
void *my_memcpy(void *dest, const void *src, size_t num);
int main()
{
    int scr[] = {9, 8, 7, 6, 5, 4, 3, 1, 2};
    int dest[20] = {0};

    my_memcpy(dest, scr, 20);
    // 打印复制的内容
    for (int i = 0; i < 5; i++)
    {
        printf("%d ", dest[i]);
    }

    return 0;
}

void *my_memcpy(void *dest, const void *src, size_t num)
{
	assert(dest && src);// 使用断言函数判断两个void*指针是否为空指针 
    void *ret = dest;//记录目标空间的起始地址
    while (num--)
    {
    	// 交换每个地址里的内容
        *(char *)dest = *(char *)src;
        dest = (char *)dest + 1;
        src = (char *)src + 1;
    }

    return (ret);
}

八、memmove函数

函数原型

void* memmove(void* dest, const void* src, size_t count)

dest：指向复制对象的指针

src：指向复制来源的指针

count：要复制的字节数

返回值是目标空间的起始地址。

函数功能：把src所指向的对象复制count个字节到dest所指向的对象。

函数功能测试

#include <stdio.h>
#include <string.h>
int main()
{
	int arr[] = {1, 2, 3, 4, 5, 6, 7, 8};
	size_t len = sizeof(arr) / sizeof(*arr);
	printf("更改前：");
	for (size_t i = 0; i < len; i++)
	{
		printf("%d ", *(arr + i));
	}
	memmove(arr + 2, arr, 20);
	printf("\n更改后：");
	for (size_t i = 0; i < len; i++)
	{
		printf("%d ", *(arr + i));
	}
	
	return 0;
}

8.1、注意事项

若字符指针dest或字符指针src为空指针或是非法指针，则导致程序崩溃。
memmove函数的两个参数指向的对象可以重叠。
程序员应该确保dest和src指向的内存块足够大，可以容纳count个字节，否则导致内存越界错误。

8.2、memmove函数的模拟实现

#include <stdio.h>
#include <assert.h>
void* my_memmove(void* dest, void* src, size_t count);
int main()
{
	int dest[9] = { 1, 2, 3, 4, 5, 6, 7, 8, 9 };
	int len = sizeof(dest) / sizeof(*dest);
	printf("移动前：");
	// 移动前的数组
	for (int i = 0; i < len; i++)
	{
		printf("%d ", dest[i]);
	}
	my_memmove(dest + 2, dest, 20);
	printf("\n移动后：");
	// 移动后的数组
	for (int i = 0; i < len; i++)
	{
		printf("%d ", dest[i]);
	}

	return 0;
}

void* my_memmove(void* dest, void* src, size_t count)
{
	assert(dest && src);
	char* ret = dest;// 记录目标空间的起始地址
	if (src > dest)
	{
		while (count--)
		{
			*(char*)dest = *(char*)src;
			dest = (char*)dest + 1;
			src = (char*)src + 1;
		}
	}
	else
	{
		while (count--)
		{
			*((char*)dest + count) = *((char*)src + count);
		}
	}

	return (ret);
}

小编IT初入门，上述讲解如有错误，请多多指教。