C++切割字符串

转载:本文实例汇总了C++常用字符串分割方法,分享给大家供大家参考。具体分析如下:

string str;getline(cin,str);getline函数是遇回车符结束输入,而一般的CIN是遇到空格之类的就结束输入 string 类可以。需要注意的是输入字符串到这个(getline(cin,str))

我们在编程的时候经常会碰到字符串分割的问题,这里总结下,也方便我们以后查询使用。

一、用strtok函数进行字符串分割

原型: char *strtok(char *str, const char *delim);

功能:分解字符串为一组字符串。

参数说明:str为要分解的字符串,delim为分隔符字符串。

返回值:从str开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。

其它:strtok函数线程不安全,可以使用strtok_r替代。

示例:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

//借助strtok实现split

#include <string.h>

#include <stdio.h>

 

int main()

{

    char s[] = "Golden Global   View,disk * desk";

    const char *d = " ,*";

    char *p;

    p = strtok(s,d);

    while(p)

    {

        printf("%s\n",p);

        p=strtok(NULL,d);

    }

 

    return 0;

}

运行效果如下图所示:

二、用STL进行字符串的分割

涉及到string类的两个函数find和substr:
1、find函数
原型:size_t find ( const string& str, size_t pos = 0 ) const;
功能:查找子字符串第一次出现的位置。
参数说明:str为子字符串,pos为初始查找位置。
返回值:找到的话返回第一次出现的位置,否则返回string::npos

2、substr函数
原型:string substr ( size_t pos = 0, size_t n = npos ) const;
功能:获得子字符串。
参数说明:pos为起始位置(默认为0),n为结束位置(默认为npos)
返回值:子字符串

实现如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

//字符串分割函数

std::vector<std::string> split(std::string str,std::string pattern)

{

  std::string::size_type pos;

  std::vector<std::string> result;

  str+=pattern;//扩展字符串以方便操作

  int size=str.size();

 

  for(int i=0; i<size; i++)

  {

    pos=str.find(pattern,i);

    if(pos<size)

    {

      std::string s=str.substr(i,pos-i);

      result.push_back(s);

      i=pos+pattern.size()-1;

    }

  }

  return result;

}

完整代码:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

/*

    File   : split1.cpp

    Author  : Mike

    E-Mail  : Mike_Zhang@live.com

 */

#include <iostream>

#include <string>

#include <vector>

 

//字符串分割函数

std::vector<std::string> split(std::string str,std::string pattern)

{

  std::string::size_type pos;

  std::vector<std::string> result;

  str+=pattern;//扩展字符串以方便操作

  int size=str.size();

 

  for(int i=0; i<size; i++)

  {

    pos=str.find(pattern,i);

    if(pos<size)

    {

      std::string s=str.substr(i,pos-i);

      result.push_back(s);

      i=pos+pattern.size()-1;

    }

  }

  return result;

}

 

int main()

{

  std::string str;

  std::cout<<"Please input str:"<<std::endl;

  //std::cin>>str;

  getline(std::cin,str);

  std::string pattern;

  std::cout<<"Please input pattern:"<<std::endl;

  //std::cin>>pattern;

  getline(std::cin,pattern);//用于获取含空格的字符串

  std::vector<std::string> result=split(str,pattern);

  std::cout<<"The result:"<<std::endl;

  for(int i=0; i<result.size(); i++)

  {

    std::cout<<result[i]<<std::endl;

  }

 

  std::cin.get();

  std::cin.get();

  return 0;

}

运行效果如下图所示:

三、用Boost进行字符串的分割

用boost库的正则表达式实现字符串分割
实现如下:

1

2

3

4

5

6

7

8

9

10

11

12

std::vector<std::string> split(std::string str,std::string s)

{

    boost::regex reg(s.c_str());

    std::vector<std::string> vec;

    boost::sregex_token_iterator it(str.begin(),str.end(),reg,-1);

    boost::sregex_token_iterator end;

    while(it!=end)

    {

        vec.push_back(*it++);

    }

    return vec;

}

完整代码:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

//本程序实现的是利用正则表达式对字符串实现分割

//运行环境   VC6.0 + boost 库

/*

    File   : split2.cpp

    Author  : Mike

    E-Mail  : Mike_Zhang@live.com

*/

#include <iostream>

#include <cassert>

#include <vector>

#include <string>

#include "boost/regex.hpp"

 

std::vector<std::string> split(std::string str,std::string s)

{

    boost::regex reg(s.c_str());

    std::vector<std::string> vec;

    boost::sregex_token_iterator it(str.begin(),str.end(),reg,-1);

    boost::sregex_token_iterator end;

    while(it!=end)

    {

        vec.push_back(*it++);

    }

    return vec;

}

int main()

{

    std::string str,s;

    str="sss/ddd/ggg/hh";

    s="/";

    std::vector<std::string> vec=split(str,s);

    for(int i=0,size=vec.size();i<size;i++)

    {

        std::cout<<vec[i]<<std::endl;

    }

    std::cin.get();

    std::cin.get();

    return 0;

}

运行效果如下图所示:

补充:

最近发现boost里面有自带的split的函数,如果用boost的话,还是直接用split的好,这里就不多说了,代码如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

#include <iostream>

#include <string>

#include <vector>

#include <boost/algorithm/string/classification.hpp>

#include <boost/algorithm/string/split.hpp>

  

using namespace std;

  

int main()

{

 string s = "sss/ddd,ggg";

 vector<string> vStr;

 boost::split( vStr, s, boost::is_any_of( ",/" ), boost::token_compress_on );

 for( vector<string>::iterator it = vStr.begin(); it != vStr.end(); ++ it )

  cout << *it << endl;

 return 0;

}

<think>好的,用户之前问过关于C++分割字符串的问题,并且我给出了几种不同的方法。现在用户再次提问“c++ 分割字符串”,我需要确保这次的回答既全面又简洁,同时考虑到用户可能的深层需求。 首先,用户可能已经看过之前的回答,但需要更详细的解释或不同的方法。或者他们可能希望得到更优化的代码,或者针对特定场景的解决方案。我需要检查之前的回答是否覆盖了所有常见方法,或者是否有遗漏。 之前的回答提到了四种方法:istringstream+getline、find+substr、正则表达式、Boost库。这些都是标准的方法,但可能用户需要更高效的实现,或者更简单的代码。另外,用户可能对某些方法的具体应用场景有疑问,比如处理多字符分隔符或保留空字符串。 我需要确保这次的回答结构清晰,每种方法都有示例代码和优缺点说明。同时,可能需要补充一些用户可能关心的点,比如性能比较,或者如何处理特殊字符。 另外,用户可能在实际使用中遇到了问题,比如分割后的空字符串处理,或者分隔符是多个字符的情况。这时候需要提供具体的解决方案,比如在第二种方法中如何修改代码来保留空部分。 还要注意是否应该推荐使用C++17的string_view来提高性能,尤其是在处理大字符串时。或者是否提到第三方库如absl的分割方法,但用户可能更倾向于标准库或Boost。 最后,相关问题部分需要覆盖用户可能遇到的常见问题,比如多分隔符、保留空字符串、性能优化等。确保问题具有针对性,能够引导用户进一步思考或查找解决方案。</think>在 C++ 中,字符串分割是一个常见需求,但标准库并未提供直接的 `split()` 函数(如 Python)。以下是几种主流实现方式,涵盖不同场景和性能考量。 --- ### ✅ 方法 1:使用 `std::istringstream` + `std::getline`(单字符分隔符) **适用场景**:按单字符分隔符(如逗号、空格)分割,且无需保留空字符串。 ```cpp #include <sstream> #include <vector> #include <string> std::vector<std::string> split(const std::string& s, char delimiter) { std::vector<std::string> tokens; std::string token; std::istringstream tokenStream(s); while (std::getline(tokenStream, token, delimiter)) { tokens.push_back(token); } return tokens; } ``` **特点**: - 简洁易懂,适合初学者。 - 自动跳过空字符串(如 `"a,,b"` 会得到 `["a", "b"]`)。 - **缺点**:无法处理多字符分隔符(如 `"||"`)。 --- ### ✅ 方法 2:使用 `std::string::find` + `substr`(多字符分隔符) **适用场景**:需要支持多字符分隔符(如 `", "` 或 `"||"`),或保留空字符串。 ```cpp #include <vector> #include <string> std::vector<std::string> split(const std::string& s, const std::string& delimiter) { std::vector<std::string> tokens; size_t start = 0; size_t end = s.find(delimiter); while (end != std::string::npos) { tokens.push_back(s.substr(start, end - start)); start = end + delimiter.length(); end = s.find(delimiter, start); } tokens.push_back(s.substr(start)); // 添加最后一个子串 return tokens; } ``` **特点**: - 支持多字符分隔符。 - 可通过修改代码保留空字符串(如 `"a,,b"` 保留中间的空字符串)。 - **缺点**:代码复杂度略高。 --- ### ✅ 方法 3:使用正则表达式(C++11+) **适用场景**:按复杂模式分割(如多个空格、标点符号混合)。 ```cpp #include <regex> #include <vector> #include <string> std::vector<std::string> split(const std::string& s, const std::string& pattern) { std::regex re(pattern); std::sregex_token_iterator first{s.begin(), s.end(), re, -1}, last; return {first, last}; } ``` **示例**: ```cpp std::string s = "a, b; c|d"; auto tokens = split(s, "[,;| ]+"); // 按逗号、分号、竖线或空格分割 // 输出: ["a", "b", "c", "d"] ``` **特点**: - 灵活支持复杂模式匹配。 - 需要 `<regex>` 头文件(C++11+)。 - **缺点**:正则表达式语法较复杂,可能影响性能。 --- ### ✅ 方法 4:使用 Boost 库(第三方) **适用场景**:项目允许使用 Boost,追求代码简洁和功能强大。 ```cpp #include <boost/algorithm/string.hpp> #include <vector> #include <string> std::vector<std::string> split(const std::string& s, const std::string& delimiter) { std::vector<std::string> tokens; boost::split(tokens, s, boost::is_any_of(delimiter)); return tokens; } ``` **特点**: - 代码简洁,功能丰富(如忽略大小写、跳过空部分)。 - **缺点**:依赖 Boost 库(非标准库)。 --- ### ✅ 方法 5:使用 C++17 `std::string_view`(高性能) **适用场景**:处理大字符串时避免频繁拷贝,提升性能。 ```cpp #include <string_view> #include <vector> std::vector<std::string_view> split(std::string_view s, char delimiter) { std::vector<std::string_view> tokens; size_t start = 0; size_t end = s.find(delimiter); while (end != std::string_view::npos) { tokens.push_back(s.substr(start, end - start)); start = end + 1; end = s.find(delimiter, start); } tokens.push_back(s.substr(start)); return tokens; } ``` **特点**: - 使用 `std::string_view` 避免拷贝,适合高性能场景。 - C++17 标准支持。 --- ### 📌 注意事项 1. **空字符串处理**: - 默认不保留空字符串(如 `"a,,b"` 会跳过中间空部分)。 - 需要保留时,可在 `find` + `substr` 方法中调整逻辑。 2. **性能优化**: - 对超长字符串使用 `std::string_view` 或 `std::span`(C++20)减少拷贝。 3. **多线程场景**: - 上述方法均为单线程,如需并发需自行加锁或使用线程安全容器。 4. **分隔符匹配**: - 若分隔符为多字符(如 `"||"`),需使用 `find` + `substr` 或正则表达式。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值