C++ split


#include <iostream>
#include <vector>
#include <string>
using namespace std;

//find函数寻找完整匹配,find_first_of函数寻找任一匹配
//http://www.cnblogs.com/mumuliang/archive/2009/11/20/1873571.html
vector<string> split(string s, string delim){
  vector<string> res;

  int start = 0;
  int end = -1;
  //跳过首端的连续分割符
  while ((end = s.find_first_of(delim, start)) == start)
    start = end + 1;

  while ((end = s.find_first_of(delim, start)) != string::npos){
    res.push_back(s.substr(start, end - start));
    start = end + 1;
    //跳过连续分割符
    while ((end = s.find_first_of(delim, start)) == start)
      start = end + 1;
  }
  //最后一段
  if (start < s.size()){
    res.push_back(s.substr(start));
  }

  return res;
}

int main(){
  vector<string> res = split("    ab cd  ef gh    ", " ");
  vector<string> res2 = split("    ab cd##ef gh######", " #");

  int ttt = 0;
  return 0;
}


### C++ 中实现字符串分割功能 尽管 C++ 标准库未提供内置的 `split` 函数[^1],但可以通过多种方式实现类似的字符串分割功能。以下是几种常见且优雅的实现方法: #### 方法一:基于 `std::string` 的 `find` 和子串提取 可以利用 `std::string` 提供的成员函数 `find` 来定位分隔符的位置,并通过循环逐步提取子字符串。 ```cpp #include <iostream> #include <vector> #include <string> std::vector<std::string> split(const std::string& s, const std::string& delimiter) { std::vector<std::string> result; size_t pos_start = 0, pos_end, delim_len = delimiter.length(); while ((pos_end = s.find(delimiter, pos_start)) != std::string::npos) { result.emplace_back(s.substr(pos_start, pos_end - pos_start)); pos_start = pos_end + delim_len; } result.emplace_back(s.substr(pos_start)); // 添加最后一个部分 return result; } int main() { std::string input = "apple,banana,cherry"; std::vector<std::string> tokens = split(input, ","); for (const auto& token : tokens) { std::cout << token << "\n"; } } ``` 这种方法的优点在于不依赖外部库,仅使用标准库即可完成任务。 --- #### 方法二:使用 `strtok` 进行字符串分割 如果允许修改原始字符串,则可以考虑使用 `<cstring>` 头文件中的 `strtok` 函数[^2]。需要注意的是,`strtok` 修改输入字符串并将其分解为多个标记。 ```cpp #include <iostream> #include <cstring> void tokenize(char* str, const char* delims) { char* token = strtok(str, delims); while (token != nullptr) { std::cout << token << "\n"; token = strtok(nullptr, delims); // 继续获取下一个标记 } } int main() { char input[] = "apple,banana,cherry"; // 必须是字符数组而非 string 对象 tokenize(input, ","); } ``` 此方法简单高效,但在多线程环境中需谨慎使用,因为 `strtok` 不具备线程安全性。 --- #### 方法三:借助 Boost 库中的 `boost::split` 对于需要更高抽象层次的应用场景,可以选择引入第三方库 Boost 并使用其提供的 `boost::split` 函数[^3]。 ```cpp #include <iostream> #include <vector> #include <string> #include <boost/algorithm/string.hpp> int main() { std::string input = "apple,banana,cherry"; std::vector<std::string> tokens; boost::split(tokens, input, [](char c){ return c == ','; }); for (const auto& token : tokens) { std::cout << token << "\n"; } } ``` 虽然这种方式增加了对外部库的依赖,但它提供了更简洁和灵活的接口设计。 --- #### 自定义实现注意事项 无论采用哪种方法,在实际开发过程中都应关注以下几点: - **性能优化**:避免不必要的内存分配或拷贝操作。 - **边界条件处理**:确保能够正确应对空字符串、连续分隔符等情况[^4]。 - **跨平台兼容性**:某些特定实现可能因编译器差异而表现不同。 综上所述,可以根据具体需求选择合适的方案来实现 C++ 字符串分割功能[^5]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值