今天的主题是C语言的字符串函数,通过学习并模拟实现它们,来深刻理解它们的使用。
目录
(一)strlen函数:
介绍:
函数原型:
size_t strlen ( const char * str );
函数名 | 功能描述 | 头文件 |
strlen | 用来求字符串的长度 | #include<string.h> |
传参说明: 传参传过去的是字符串首元素的地址。
返回值说明:从字符串的首元素开始计数统计,遇到'\0'结束统计。返回值反映的是字符串 中'\0'出现之前字符的个数
使用示例:
#include<stdio.h>
#include<string.h>
int main()
{
const char* str = "hello world";
printf("%zd", strlen(str));
return 0;
}
【输出说明】:11
模拟实现:
#include<stdio.h>
#include<assert.h>
//模拟实现strlen函数:
//方法一:计数器
size_t my_strlen_one(const char* str)
{
assert(str != NULL);
size_t len = 0;
while (*str++)
{
len++;
}
return len;
}
//方法二:函数递归
size_t my_strlen_two(const char* str)
{
assert(str != NULL);
if (*str =='\0')
{
return 0;
}
else
{
return 1 + my_strlen_two(str+1);
}
}
//方法三:指针减指针
size_t my_strlen_three(const char* str)
{
const char* init = str;
assert(str != NULL);
while (*str)
{
str++;
}
return str - init;
}
int main()
{
char* str = "Hello world!";
char* str1 = "";
printf("%zd\n", my_strlen_one(str));
printf("%zd\n", my_strlen_two(str));
printf("%zd\n", my_strlen_three(str1));
return 0;
}
(二)strcpy函数:
介绍:
函数原型:
char * strcpy ( char * destination, const char * source );
函数名 | 功能描述 | 头文件 |
strcpy | 进行字符串的拷贝 | #include<string.h> |
传参说明:第一个参数是目标字符串的首地址,第二个参数是源字符串的首地址。
返回值说明:这个函数会拷贝源字符串的字符内容到目标地址里面,遇到source的'\0',执行最后一次拷贝并且结束这个拷贝的过程,最后返回目标空间(字符串)destination的首地址。
使用示例:
#include<stdio.h>
#include<string.h>
int main()
{
const char* str = "hello world";
char det[20];
char* ptr = strcpy(det, str);
printf("%s\n", str);
printf("%s\n", ptr);
printf("%s", det);
return 0;
}
【输出说明】:hello world
hello world
hello world
模拟实现:
#include<stdio.h>
#include<assert.h>
//模拟实现strcpy函数:
char* my_strcpy(char* dest, const char* src)
{
assert(dest && src);
char* init = dest;
while (*dest++ = *src++)
{
;
}
return init;
}
int main()
{
char* src = "Hello world!";
char dest[20];
char* str = my_strcpy(dest, src);
printf("src: %s\n", src);
printf("dest: %s\n", dest);
printf("str:%s", str);
return 0;
}
注意事项:
- 源字符串中务必有'\0',不然实际上,你拷贝了什么东西这是不可控的;
- 作为一名合格的程序员,请务必保证目标空间destination的容量足够大,能够放得下源字符串的所有内容。如果destination的容量不够,程序会异常终止。
- 目标空间destination的内容必须可变,即destination指针所指向的内容不被const修饰。如果你不遵循,运行会出错。
(三)strcmp函数:
介绍:
函数原型:
int strcmp ( const char * str1, const char * str2 );
函数名 | 功能描述 | 头文件 |
strcmp | 进行两个字符串之间大小的比较 | #include<string.h> |
传参说明:传过来的是待比较的两个字符串的首元素的地址。
返回值说明:返回的是一个int类型的整数,反映的是str1和str2之间的大小关系。比较规则是:从左到右依次比较,取各个对应字符的Ascll码值进行比较。如果对应位置两个字符相等,则继续这个过程,碰到不相等的字符立马停止这个过程。或其中一个字符串遇到'\0'结束这个过程
具体情况参考下面表格
return value | 含义 |
<0 | 表明str1 < str2 |
=0 | 表明str1 == str2 |
>0 | 表明str1 > str2 |
值得注意的是:具体大于0小于0的数字是什么,是ANSIC(C语言标准所没有规定的)。
使用示例:
#include<stdio.h>
#include<string.h>
int main()
{
const char* str1 = "abc";
const char* str2 = "abc";
const char* str3 = "bcd";
const char* str4 = "abcde";
const char* str5 = "Abc";
//如果两个字符串相等:
printf("%d\n", strcmp(str1, str2));
//如果第二个字符串大于第一个字符串:
printf("%d\n", strcmp(str1, str3));
//如果第二个字符串长度大于第一个字符串:
printf("%d\n", strcmp(str1, str4));
//如果第二个字符串小于第一个字符串:
printf("%d\n", strcmp(str1, str5));
return 0;
}
【输出说明】:0 -1 -1 1 (注:测试结果依赖于编译器环境)
模拟实现:
#include<stdio.h>
#include<assert.h>
//模拟实现strcmp的功能
int my_strcmp(const char* str1, const char* str2)
{
while (*str1 == *str2)
{
if (*str1 == '\0')
return 0;
str1++;
str2++;
}
return *str1 - *str2;
}
int main()
{
const char* str1 = "abcd";
const char* str2 = "abc";
if (my_strcmp(str1, str2) > 0)
{
printf("str1这个字符串更大");
}
else if (my_strcmp(str1, str2) < 0)
{
printf("str2这个字符串更大");
}
else
{
printf("str1和str2字符串相等");
}
return 0;
}
(四)strcat函数:
介绍:
函数原型:
char * strcat ( char * destination, const char * source );
函数名 | 功能描述 | 头文件 |
strcat | 用来进行字符串的追加 | #include<string.h> |
传参说明:第一个参数是被追加的字符串的首元素的地址,第二个参数是待追加字符串的首 元素的地址。
返回值说明:从destination的末尾'\0'开始进行追加,将source字符串的内容依次拷贝到destination的后面,遇到source的'\0',执行最后一次追加。最终返回的是被追加字符后的destination的地址。
使用示例:
#include<stdio.h>
#include<string.h>
int main()
{
char dest[35] = "Beijing is the";
const char* sour = " capital of China.";
printf("追加前:%s\n", dest);
strcat(dest, sour);
printf("追加后:%s\n", dest);
return 0;
}
【输出说明】:追加前:Beijing is the
追加后:Beijing is the capital of China.
模拟实现:
#include<stdio.h>
#include<assert.h>
//模拟实现strcat函数的功能:
char* my_strcat(char* dest, const char* src)
{
int cnt = 0;
char* init = dest;
assert(dest && src);
//第一步定位:定位到dest的末尾
while (*dest)
{
dest++;
cnt++;
}
//第二步追加:
while (*src && cnt)
{
*dest = *src;
dest++;
src++;
cnt--;
}
//第三步处理细节:
if (*src == '\0')
{//处理用户追加不同字符串的情况:
*dest = *src;
}
else
{//处理用户追加同一个字符串的情况:
*++dest = '\0';
}
return init;
}
int main()
{
char str1[20] = "You are ";
const char* str2 = "welcome!";
printf("追加之前str1:%s\n", str1);
my_strcat(str1, str2);
printf("追加之后str1:%s\n", str1);
return 0;
}
【难点解剖】
ANSIC仅针对strcat函数追加两个不同字符串的情况进行规定,这里说的不同,指的是两个字符 串的地址不同。所以追加同一个字符串是strcat函数的C语言标准所没有规定的。
我们在这里加上了这个功能,这也是strcat函数实现的难点所在。因为:追加同一个字符串的过程 中会覆盖掉dest字符串的'\0',如果这里得不到恰当的处理,那追加的过程就是个死循环。
为了解决这里的问题,我们使用一个计数器cnt来记录dest字符串的初始长度,然后追加的时候, 只追加字符串dest的长度次。
因为是模拟实现,所以不允许使用string.h头文件里面的库函数,不然这个计数器其实也可以用 strlen函数替代。
注意事项:
- 要从destination的末尾进行追加,要找到它的末尾就需要destination字符串包含'\0'。此外,追加的字符串有多少是由source字符串的'\0'来决定的,所以source也要有'\0'。即我们的用户要保证他传过来的两个字符串都要有'\0'。
- 和strcpy函数那里一样,destination的空间要足够大,至少能同时放得下source和destination两个的字符串内容数据。