在C, C++程序开发过程中,经常碰到字符串分割的问题,参考互联网上其他朋友的实现, 这里总结下,也方便自己和他人以后使用。
一、用strtok函数进行字符串分割
原型: char *strtok(char *str, const char *delim);
功能:分解字符串为一组字符串。
参数说明:str为要分解的字符串,delim为分隔符字符串。
返回值:从str开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。
示例:
01 | //借助strtok实现split |
02 | #include <string.h> |
03 | #include <stdio.h> |
04 |
05 | int main() |
06 | { |
07 | char s[] = "Golden Global View,disk * desk" ; |
08 | const char *d = " ,*" ; |
09 | char *p; |
10 | p = strtok (s,d); |
11 | while (p) |
12 | { |
13 | printf ( "%sn" ,p); |
14 | p= strtok (NULL,d); |
15 | } |
16 |
17 | return 0; |
18 | } |
运行效果:
二、用STL进行字符串的分割
涉及到string类的两个函数find和substr:
1、find函数
原型:size_t find ( const string& str, size_t pos = 0 ) const;
功能:查找子字符串第一次出现的位置。
参数说明:str为子字符串,pos为初始查找位置。
返回值:找到的话返回第一次出现的位置,否则返回string::npos
2、substr函数
原型:string substr ( size_t pos = 0, size_t n = npos ) const;
功能:获得子字符串。
参数说明:pos为起始位置(默认为0),n为结束位置(默认为npos)
返回值:子字符串
实现如下:
01 | //字符串分割函数 |
02 | std::vector<std::string> split(std::string str,std::string pattern) |
03 | { |
04 | std::string::size_type pos; |
05 | std::vector<std::string> result; |
06 | str+=pattern; //扩展字符串以方便操作 |
07 | int size=str.size(); |
08 |
09 | for ( int i=0; i<size; i++) |
10 | { |
11 | pos=str.find(pattern,i); |
12 | if (pos<size) |
13 | { |
14 | std::string s=str.substr(i,pos-i); |
15 | result.push_back(s); |
16 | i=pos+pattern.size()-1; |
17 | } |
18 | } |
19 | return result; |
20 | } |
完整代码:
01 | #include <iostream> |
02 | #include <string> |
03 | #include <vector> |
04 |
05 | //字符串分割函数 |
06 | std::vector<std::string> split(std::string str,std::string pattern) |
07 | { |
08 | std::string::size_type pos; |
09 | std::vector<std::string> result; |
10 | str+=pattern; //扩展字符串以方便操作 |
11 | int size=str.size(); |
12 |
13 | for ( int i=0; i<size; i++) |
14 | { |
15 | pos=str.find(pattern,i); |
16 | if (pos<size) |
17 | { |
18 | std::string s=str.substr(i,pos-i); |
19 | result.push_back(s); |
20 | i=pos+pattern.size()-1; |
21 | } |
22 | } |
23 | return result; |
24 | } |
25 |
26 | int main() |
27 | { |
28 | std::string str; |
29 | std::cout<< "Please input str:" <<std::endl; |
30 | //std::cin>>str; |
31 | getline(std::cin,str); |
32 | std::string pattern; |
33 | std::cout<< "Please input pattern:" <<std::endl; |
34 | //std::cin>>pattern; |
35 | getline(std::cin,pattern); //用于获取含空格的字符串 |
36 | std::vector<std::string> result=split(str,pattern); |
37 | std::cout<< "The result:" <<std::endl; |
38 | for ( int i=0; i<result.size(); i++) |
39 | { |
40 | std::cout<<result[i]<<std::endl; |
41 | } |
42 |
43 | std::cin.get(); |
44 | std::cin.get(); |
45 | return 0; |
46 | } |
运行效果:
三、用Boost进行字符串的分割
用boost库的正则表达式实现字符串分割
实现如下:
01 | std::vector<std::string> split(std::string str,std::string s) |
02 | { |
03 | boost::regex reg(s.c_str()); |
04 | std::vector<std::string> vec; |
05 | boost::sregex_token_iterator it(str.begin(),str.end(),reg,-1); |
06 | boost::sregex_token_iterator end; |
07 | while (it!=end) |
08 | { |
09 | vec.push_back(*it++); |
10 | } |
11 | return vec; |
12 | } |
完整代码:
01 | #include <iostream> |
02 | #include <cassert> |
03 | #include <vector> |
04 | #include <string> |
05 | #include "boost/regex.hpp" |
06 |
07 | std::vector<std::string> split(std::string str,std::string s) |
08 | { |
09 | boost::regex reg(s.c_str()); |
10 | std::vector<std::string> vec; |
11 | boost::sregex_token_iterator it(str.begin(),str.end(),reg,-1); |
12 | boost::sregex_token_iterator end; |
13 | while (it!=end) |
14 | { |
15 | vec.push_back(*it++); |
16 | } |
17 | return vec; |
18 | } |
19 | int main() |
20 | { |
21 | std::string str,s; |
22 | str= "sss/ddd/ggg/hh" ; |
23 | s= "/" ; |
24 | std::vector<std::string> vec=split(str,s); |
25 | for ( int i=0,size=vec.size();i<size;i++) |
26 | { |
27 | std::cout<<vec[i]<<std::endl; |
28 | } |
29 | std::cin.get(); |
30 | std::cin.get(); |
31 | return 0; |
32 | } |
运行效果:
其实boost里面有自带的split的函数,如果用boost的话,还是直接用split的好,这里就不多说了.