【C++】Split

如果要将类似“aa ss ff”的字符串按空格分割成一个个字符,Java、C#、PHP或者python等其它语言写多的人,就会认为split一个理应存在的方法, 实际上C++中并没有这个方法,需要我们自己去写。毕竟,C++是一个用字符串,都要引用string头文件的语言!

下面提供一个自己写的C++的Split函数:

vector<string> split(string str,string separator){  
	vector<string> result;
	int cutAt;  
	while((cutAt = str.find_first_of(separator))!=str.npos){  
		if(cutAt>0){  
			result.push_back(str.substr(0,cutAt));
		}  
		str=str.substr(cutAt+1);  
	}  
	if(str.length()>0){  
		result.push_back(str);  
	}  
	return result;  
}

这个函数利用到一个名为result,C++的vector,具体见《【C++】容器类》( 点击打开链接),也就是动态数据来存储字符串被分割之后的一个个部分。

这个函数的具体思想如下:


在传入的字符串str,一次又一次地寻找在这个字符串str中的separator位置,然后在这个位置一次次进行自带的substring方法切割,没切割一次就将这部分存入result中,同时再对余下部分做重复的动作,从而实现Split的功能。具体用法如下:

#include "iostream"
#include "vector"
#include "string"//纯粹为了c++用cout输出string的时候,不报错。
using namespace std;
//打印容器vector  
void printVector(vector<string> vector1){
	for(int i=0;i<int(vector1.size());i++){  
		cout<<vector1[i]<<endl;  
	}  
}
//split函数
vector<string> split(string str,string separator){  
	vector<string> result;
	int cutAt;  
	while((cutAt = str.find_first_of(separator))!=str.npos){  
		if(cutAt>0){  
			result.push_back(str.substr(0,cutAt));
		}  
		str=str.substr(cutAt+1);  
	}  
	if(str.length()>0){  
		result.push_back(str);  
	}  
	return result;  
}
//用了两个字符串与两个不同的分隔符测试
int main(){
	string s="aaa ass  sddd www rr";
	vector<string> ret;
	ret=split(s," ");  
	printVector(ret);
	cout<<endl;
	s="as,sqw,wqe,tr,q";
	ret=split(s,",");  
	printVector(ret);
	return 0;
}

运行结果如下图所示:


### C++ 中实现字符串分割功能 尽管 C++ 标准库未提供内置的 `split` 函数[^1],但可以通过多种方式实现类似的字符串分割功能。以下是几种常见且优雅的实现方法: #### 方法一:基于 `std::string` 的 `find` 和子串提取 可以利用 `std::string` 提供的成员函数 `find` 来定位分隔符的位置,并通过循环逐步提取子字符串。 ```cpp #include <iostream> #include <vector> #include <string> std::vector<std::string> split(const std::string& s, const std::string& delimiter) { std::vector<std::string> result; size_t pos_start = 0, pos_end, delim_len = delimiter.length(); while ((pos_end = s.find(delimiter, pos_start)) != std::string::npos) { result.emplace_back(s.substr(pos_start, pos_end - pos_start)); pos_start = pos_end + delim_len; } result.emplace_back(s.substr(pos_start)); // 添加最后一个部分 return result; } int main() { std::string input = "apple,banana,cherry"; std::vector<std::string> tokens = split(input, ","); for (const auto& token : tokens) { std::cout << token << "\n"; } } ``` 这种方法的优点在于不依赖外部库,仅使用标准库即可完成任务。 --- #### 方法二:使用 `strtok` 进行字符串分割 如果允许修改原始字符串,则可以考虑使用 `<cstring>` 头文件中的 `strtok` 函数[^2]。需要注意的是,`strtok` 修改输入字符串并将其分解为多个标记。 ```cpp #include <iostream> #include <cstring> void tokenize(char* str, const char* delims) { char* token = strtok(str, delims); while (token != nullptr) { std::cout << token << "\n"; token = strtok(nullptr, delims); // 继续获取下一个标记 } } int main() { char input[] = "apple,banana,cherry"; // 必须是字符数组而非 string 对象 tokenize(input, ","); } ``` 此方法简单高效,但在多线程环境中需谨慎使用,因为 `strtok` 不具备线程安全性。 --- #### 方法三:借助 Boost 库中的 `boost::split` 对于需要更高抽象层次的应用场景,可以选择引入第三方库 Boost 并使用其提供的 `boost::split` 函数[^3]。 ```cpp #include <iostream> #include <vector> #include <string> #include <boost/algorithm/string.hpp> int main() { std::string input = "apple,banana,cherry"; std::vector<std::string> tokens; boost::split(tokens, input, [](char c){ return c == ','; }); for (const auto& token : tokens) { std::cout << token << "\n"; } } ``` 虽然这种方式增加了对外部库的依赖,但它提供了更简洁和灵活的接口设计。 --- #### 自定义实现注意事项 无论采用哪种方法,在实际开发过程中都应关注以下几点: - **性能优化**:避免不必要的内存分配或拷贝操作。 - **边界条件处理**:确保能够正确应对空字符串、连续分隔符等情况[^4]。 - **跨平台兼容性**:某些特定实现可能因编译器差异而表现不同。 综上所述,可以根据具体需求选择合适的方案来实现 C++ 字符串分割功能[^5]。 ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值