C/C++ 常用字符串函数实现

C字符串函数详解
本文详细介绍了C语言中常用的字符串处理函数,包括strcpy、strncpy、strcat、strncat、strchr、strcmp、strlen、strstr、strpbrk、strspn及strtok等。每个函数均附有具体的功能描述、使用方法、返回值说明及实现代码。

1、
函数名: strcpy
功  能: 将参数src字符串拷贝至参数dest所指的地址
用  法: char *strcpy(char *dest, const char *src);
返回值: 返回参数dest的字符串起始地址
说  明: 如果参数dest所指的内存空间不够大,可能会造成缓冲溢出的错误情况,在编写程序时需特别留意,或者用strncpy()来取代

char *strcpy(char *dest, const char *src)
{
	assert(dest != NULL && src != NULL);
	char *result = dest;
	while ((*dest++ = *src++) != '\0');
	return result;
}

2、
函数名: strncpy
功  能: 将字符串src前n个字符拷贝到字符串dest
用  法: char *strncpy(char *dest, const char *src, size_t n);
返回值: 返回参数dest的字符串起始地址
说  明: 不像strcpy(),strncpy()不会向dest追加结束标记'\0';
       src和dest所指的内存区域不能重叠,且dest必须有足够的空间放置n个字符;

char *strncpy(char *dest, const char *src, size_t n)
{
	assert(dest != NULL && src != NULL);
	char *result = dest;
	while(n--&&(*dest++=*src++)!='\0');
	return result;
}

3、
函数名: strcat
功  能: 字符串拼接函数
用  法: char *strcat(char *dest, const char *src);
返回值: 返回dest字符串起始地址
说  明: strcat() 会将参数src字符串复制到参数dest所指的字符串尾部;
       dest最后的结束字符'\0'会被覆盖掉,并在连接后的字符串的尾部再增加一个'\0';
       dest与src所指的内存空间不能重叠,且dest要有足够的空间来容纳要复制的字符串;

char *strcat(char *dest, const char *src)
{
	assert(dest!=NULL && src!=NULL);
	char *result = dest;
	while (*dest != '\0')++dest;
	while ((*dest++ = *src++) != '\0');
	return result;
}

4、
函数名: strncat
功  能: 将n个字符追加到字符串的结尾
用  法: char *strncat(char *dest, const char *src, size_t n);
返回值: 返回dest字符串起始地址
说  明: strncat()将会从字符串src的开头拷贝n个字符到dest字符串尾部,dest要有足够的空间来容纳要拷贝的字符串;
       如果n大于字符串src的长度,那么仅将src全部追加到dest的尾部;
       strncat()会将dest字符串最后的'\0'覆盖掉,字符追加完成后,再追加'\0';

char *strncat(char *dest, const char *src, size_t n)
{
	assert(dest != NULL && src != NULL);
	char *result = dest;
	while (*dest != '\0')++dest;
	while (n-- && (*dest++ = *src++) != '\0');
	*dest = '\0';
	return result;
}

5、
函数名: strchr
功  能: 在一个字符串中查找给定字符的第一个匹配之处
用  法: char *strchr(const char *str, int c);
返回值: 如果找到指定的字符则返回该字符所在地址,否则返回NULL
说  明: 返回的地址是字符串在内存中随机分配的地址再加上你所搜索的字符在字符串的位置;
       字符串str的结束标志‘\0’也会被纳入检索范围,所以str的最后一个字符也可以被定位;
       如果希望查找某字符在字符串中最后一次出现的位置,可以使用 strrchr() 函数;

char *strchr(const char *str, int c)
{
	assert(str!=NULL);
	for (; *str != c; str++) {
		if (*str == '\0')
			return NULL;
	}
	return (char*)str;
}

6、
函数名: strcmp
功  能: 字符串比较
用  法: int strcmp(const char *s1, const char *s2);
返回值: 根据ASCII码比较,若参数s1和s2字符串相同则返回0,s1若大于s2则返回大于0的值,s1若小于s2则返回小于0的值
说  明: 它是区分大小写比较的,如果希望不区分大小写进行字符串比较,可以使用stricmp函数

int strcmp(const char *s1, const char *s2)
{
	assert(s1!=NULL &&s2!=NULL);
	while (s1 && s2 && (s1 == s2)) {
		++s1;
		++s2;
	}
	return (*s1 - *s2);
}

7、
函数名: strlen
功  能: 计算指定的字符串s的长度,不包括结束字符'\0'
用  法: size_t strlen(const char *s);
返回值: 返回字符串s的字符数
说  明: strlen() 函数计算的是字符串的实际长度,遇到第一个'\0'结束;
       如果你只定义没有给它赋初值,这个结果是不定的,它会从首地址一直找下去,直到遇到'\0'停止;
       sizeof返回的是变量声明后所占的内存数,不是实际长度,此外sizeof不是函数,仅仅是一个操作符,strlen()是函数;

size_t strlen(const char *s)
{
	assert(s != NULL);
	size_t len=0;
	while (*s++ != '\0')
		++len;
	return len;
}

8、
函数名: strstr
功  能: 检索子串在字符串中首次出现的位置
用  法: char *strstr( char *str, char * substr );

char *strstr(char *str, char * substr)
{
	assert(str!=NULL && substr!=NULL);
	char *s = str;
	char *t = substr;
	for (; *str != '\0'; str++){
		for (s = str, t = substr; *t != '\0' && *s == *t; ++s, ++t);
		if (*t == '\0')return (char*)str;
	}
	return NULL;
}

9、
函数名: strpbrk
功  能: 返回两个字符串中首个相同字符的位置
用  法: char *strpbrk(const char *s1, const char *s2);
返回值: 如果s1、s2含有相同的字符,那么返回指向s1中第一个相同字符的指针,否则返回NULL
说  明: strpbrk()不会对结束符'\0'进行检索

char *strpbrk(const char *s1,const char *s2)
{
	assert(s1!=NULL && s2!=NULL);
	const char *s,*t;
	for(s=s1;*s!='\0';s++)
		for (t=s2; *t != '\0'; t++)
		{
			if (*s == *t)
				return (char*)s;
		}
	return NULL;
}

10、
函数名:strspn
功能:返回字符串s中第一个不在accept字符串中出现的字符下标
用法size_t strspn(const char *s,const char *accept);
返回值:返回字符串s开头连续包含字符串accept内的字符数目
说明:strspn()从参数s 字符串的开头计算连续的字符,而这些字符都完全是accept 所指字符串中的字符。简单的说,若strspn()返回的数值为n,则代表字符串s 开头连续有n 个字符都是属于字符串accept内的字符。

size_t strspn(const char *str, const char *accept)
{
	assert(str!=NULL && accept!=NULL);
	size_t count=0;
	const char *s,*t;
	for (s = str; *s != '\0'; s++) {
		for (t = accept; *t != '\0'; t++) {
			if (*s == *t)
				break;
		}
		if (*t == '\0')
			return count;
		++count;
	}
	return count;
}

11、
函数名 : strtok
功  能 : 根据分界符将字符串分割成一个个片段
用  法 : char *strtok(char *s, const char *delim);
返回值 : 返回下一个分割后的字符串指针,如果已无从分割则返回NULL
说  明 : 当strtok()在参数s的字符串中发现到参数delim的分割字符时则会将该字符改为'\0'字符;
       在第一次调用时,strtok()必须赋予参数s字符串,往后的调用则将参数s设置成NULL;

char *strtok_r(char *s, const char *delim, char **save_ptr) {
	char *token;
	if (s == NULL) s = *save_ptr;
	/* Scan leading delimiters.  */
	s += strspn(s, delim);
	if (*s == '\0')
		return NULL;
	/* Find the end of the token.  */
	token = s;
	s = strpbrk(token, delim);
	if (s == NULL)
		/* This token finishes the string.  */
		*save_ptr = strchr(token, '\0');
	else {
		/* Terminate the token and make *SAVE_PTR point past it.  */
		*s = '\0';
		*save_ptr = s + 1;
	}
	return token;
}
char *strtok(char *s, const char *delim)
{
	static char *last;
	return strtok_r(s, delim, &last);
}

 

 

 

自己实现字符串类 class CMStringImp; class CMstring { public: explicit CMstring(void); ~CMstring(void); CMstring(LPCTSTR lpszstr); CMstring(const CMstring& lpszstr); CMstring& operator = (const CMstring& lpszstr); operator LPCTSTR() const; bool operator == (const CMstring&) const; bool operator != (const CMstring&) const; bool operator < (const CMstring&) const; TCHAR operator[] (int nIndex) const; TCHAR& operator[] (int nIndex); CMstring& operator += (LPCTSTR pStr); CMstring& operator += (TCHAR ch); friend CMstring operator+(const CMstring& str1, const CMstring& str2); friend CMstring operator+(const CMstring& str1, LPCTSTR lpszstr); friend CMstring operator+(const CMstring& str1, TCHAR ch); friend CMstring operator+(TCHAR ch, const CMstring& str1); friend CMstring operator+(LPCTSTR lpszstr, const CMstring& str1); // friend wostream operator <<(wostream &is;,const CMstring &str;); public: LPCTSTR GetData() const; bool IsEmpty() const; TCHAR GetAt(int) const; TCHAR& GetAt(int); int GetLength() const; int Compare(const CMstring&) const; int CompareNoCase(const CMstring&) const; int Find(TCHAR ch, int nStart = 0) const; int Find(LPCTSTR pStr, int nStart = 0) const; int ReverseFind(TCHAR ch) const; int ReverseFind(LPCTSTR pStr) const; CMstring Right(int nCount) const; CMstring Left(int nCount ) const; public: CMstring& MakeLower(); CMstring& MakeUpper(); CMstring& MakeReverse(); int Replace(TCHAR chOld, TCHAR chNew); int Replace(LPCTSTR pszOld, LPCTSTR pszNew); int Insert(int iIndex, TCHAR ch); void Format(LPCTSTR lpszFormat, ...); private: CMStringImp* m_pImp; };
<think>好的,我现在需要总结一下C/C++常用字符串函数。首先,我得回忆一下C和C++字符串处理上的不同之处。C语言主要使用字符数组和指针来处理字符串,而C++则有string类,提供了更多面向对象的方法。 先从C语言开始吧。C的字符串函数都在<string.h>头文件中。常见的函数有strlen,用来计算字符串长度,这个记得是不包括结尾的'\0'的。然后是strcpy和strncpy,用于复制字符串。strcpy可能会溢出,所以strncpy更安全些,可以指定长度。接下来是strcat和strncat,拼接字符串,同样要注意目标缓冲区的大小,避免溢出。 比较字符串的有strcmp和strncmp,前者比较整个字符串,后者可以指定比较前n个字符。查找字符的话,有strchr和strrchr,分别找第一次和最后一次出现的位置。还有strstr用来找子字符串的位置。分割字符串的strtok,这个函数会修改原字符串,需要注意线程安全问题,可能需要使用strtok_r替代。 内存操作相关的函数比如memset,memcpy,memmove,memcmp这些,虽然不专门处理字符串,但经常和字符串一起使用。比如memmove可以处理内存重叠的情况,而memcpy可能不行。 然后是C++的string类,在<string>头文件中。C++字符串操作更安全,不用手动管理内存。比如append用于追加,substr获取子串,find查找子串或字符的位置,replace替换部分字符串,compare比较字符串,还有insert插入字符等。另外,C++11引入了stoi、stol等转换函数,将字符串转为数值类型,还有to_string将数值转为字符串。 需要注意的是,C++的string和C风格字符串之间的转换,可以用c_str()方法获取const char*,但要注意生命周期的问题。还有使用stringstream进行复杂的字符串处理,比如分割或格式化。 可能还有一些不常用函数,比如strcoll根据本地环境比较字符串,strxfrm转换字符串用于比较,这些可能在多语言环境下有用,但一般用得不多。 用户可能想知道哪些函数是安全的,避免缓冲区溢出,比如推荐使用strncpy而不是strcpy,或者使用C++的string类来避免这些问题。此外,可能需要注意跨平台兼容性,某些函数在不同系统上的行为可能不同,比如strtok的线程安全问题。 总结的时候,应该分清楚C和C++的不同,分别列出常用函数,并简要说明它们的用途和注意事项。需要结构清晰,分点列出,方便用户查阅。同时要提醒用户注意安全性问题,比如缓冲区溢出和使用更安全的替代方法。</think>### C/C++ 常用字符串函数总结 --- #### **一、C 风格字符串函数(需包含 `<string.h>`)** C 语言通过字符数组(`char[]`)和指针(`char*`)处理字符串,以 `\0` 结尾。常用函数如下: | **函数** | **功能** | **注意事项** | |--------------------|-----------------------------------------|-------------------------------------------| | `strlen(const char* str)` | 返回字符串长度(不含 `\0`) | 时间复杂度为 $O(n)$,需遍历整个字符串。 | | `strcpy(char* dest, const char* src)` | 复制 `src` 到 `dest` | 不检查目标缓冲区大小,可能导致溢出。 | | `strncpy(char* dest, const char* src, size_t n)` | 复制 `src` 的前 `n` 个字符到 `dest` | 若 `n > strlen(src)`,剩余部分填充 `\0`。 | | `strcat(char* dest, const char* src)` | 将 `src` 追加到 `dest` 末尾 | 需确保 `dest` 缓冲区足够大。 | | `strncat(char* dest, const char* src, size_t n)` | 追加 `src` 的前 `n` 个字符 | 更安全,自动添加 `\0`。 | | `strcmp(const char* str1, const char* str2)` | 比较字符串(区分大小写) | 返回 `0` 表示相等,正数表示 `str1 > str2`。 | | `strncmp(const char* str1, const char* str2, size_t n)` | 比较前 `n` 个字符 | 常用于部分比较(如协议头)。 | | `strchr(const char* str, int c)` | 查找字符 `c` 首次出现的位置 | 返回指针,未找到返回 `NULL`。 | | `strrchr(const char* str, int c)` | 查找字符 `c` 最后一次出现的位置 | 常用于解析文件扩展名(如 `.txt`)。 | | `strstr(const char* haystack, const char* needle)` | 查找子串 `needle` 的位置 | 返回首次出现的指针,未找到返回 `NULL`。 | | `strtok(char* str, const char* delim)` | 按分隔符 `delim` 分割字符串 | 线程不安全(静态缓存),可改用 `strtok_r`。 | **内存操作函数(`<string.h>`):** | `memset(void* ptr, int value, size_t n)` | 将内存块填充为指定值 | 常用于初始化数组或结构体。 | | `memcpy(void* dest, const void* src, size_t n)` | 复制内存块 | 不处理内存重叠,需用 `memmove` 替代。 | | `memmove(void* dest, const void* src, size_t n)` | 安全复制内存块 | 可处理内存重叠(如数组元素移位)。 | --- #### **二、C++ `std::string` 类(需包含 `<string>`)** C++ 通过 `std::string` 类封装字符串操作,自动管理内存,更安全高效。 | **成员函数** | **功能** | **示例** | |----------------------------------|-----------------------------------------|----------------------------------------| | `length()` / `size()` | 返回字符串长度 | `s.size()` | | `append(const string& str)` | 追加字符串 | `s.append("hello")` | | `substr(size_t pos, size_t len)` | 提取子串(从 `pos` 开始,长度 `len`) | `s.substr(0, 3)` | | `find(const string& str)` | 查找子串首次出现的位置 | `s.find("abc")` 返回索引或 `string::npos` | | `replace(size_t pos, size_t len, const string& str)` | 替换子串 | `s.replace(0, 2, "xyz")` | | `c_str()` | 返回 C 风格字符串(`const char*`) | `const char* p = s.c_str()` | | `compare(const string& str)` | 比较字符串 | `s.compare("abc")`(类似 `strcmp`) | | `insert(size_t pos, const string& str)` | 在指定位置插入字符串 | `s.insert(2, "123")` | | `clear()` | 清空字符串 | `s.clear()` | **数值转换函数C++11 起):** | `stoi`, `stol`, `stof` 等 | 字符串转数值类型 | `int num = stoi("42")` | | `to_string(value)` | 数值转字符串 | `string s = to_string(3.14)` | --- #### **三、关键对比与建议** 1. **安全性**: - C 风格函数需手动管理内存,易引发溢出(如 `strcpy`)。建议优先使用 `strncpy`、`strncat` 或改用 C++ `std::string`。 - C++ `std::string` 自动处理内存,避免越界问题。 2. **性能**: - C 风格函数直接操作内存,效率高,但需谨慎使用。 - C++ 的 `std::string` 在频繁修改时可能涉及内存重分配(可通过 `reserve()` 预分配优化)。 3. **扩展性**: - C++ 支持链式调用(如 `s.append("a").replace(0,1,"b")`)。 - 复杂操作(如格式化、分割)可用 `<sstream>` 中的 `stringstream`。 --- **总结示例** ```cpp // C 风格 char str1[20] = "hello"; strcat(str1, " world"); // 需确保缓冲区足够大 // C++ 风格 std::string str2 = "hello"; str2.append(" world"); // 自动扩展内存 size_t pos = str2.find("world"); if (pos != std::string::npos) { str2.replace(pos, 5, "cpp"); } ``` $\boxed{\text{根据场景选择 C 风格或 C++ 字符串操作,优先考虑安全性和可维护性}}$
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值