使用boost库拆分字符串

本文介绍了如何使用Boost库中的tokenizer进行字符串分割,并演示了如何处理Unicode字符串分割的问题。通过两个示例,分别展示了tokenizer和split函数的具体用法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

作者:朱金灿

来源:http://blog.youkuaiyun.com/clever101

在日常开发中经常会遇到分割字符串的要求,boost库为我们提供了一个方便的分词器——boost::tokenizer。现在就让我们学习一下boost库的分词器。

#include <string> #include <iostream> #include <boost/format.hpp> #include <boost/tokenizer.hpp> #include <boost/algorithm/string.hpp> int _tmain(int argc, _TCHAR* argv[]) { // 待分割的字符串 std::string strTag = _T("I Come from China"); // 定义分割方式为英文逗号,中文逗号和空格,构造一个分词器, boost::char_separator<char> sep(" ,,"); typedef boost::tokenizer<boost::char_separator<char> > CustonTokenizer; CustonTokenizer tok(strTag,sep); // 输出分割结果 std::vector<std::string> vecSegTag; for(CustonTokenizer::iterator beg=tok.begin(); beg!=tok.end();++beg) { vecSegTag.push_back(*beg); } for (size_t i =0;i<vecSegTag.size();i++) { std::cout<<vecSegTag[i]<<std::endl; } // 尝试下分割中文字符 vecSegTag.clear(); std::string strTag2 = _T("我叫小明,你呢,今天天气不错"); CustonTokenizer tok2(strTag2,sep); for(CustonTokenizer::iterator beg=tok2.begin(); beg!=tok2.end();++beg) { vecSegTag.push_back(*beg); } for (size_t i =0;i<vecSegTag.size();i++) { std::cout<<vecSegTag[i]<<std::endl; } getchar(); return 0; }

但是boost::tokenizer的一个缺点是它不支持分割unicode字符串。所以要分割unicode字符串我们需要使用boost库提供的另一个接口——boost::split。它的使用比boost::tokenizer还要方便,请看下面代码:

#include <string> #include <iostream> #include <boost/format.hpp> #include <boost/tokenizer.hpp> #include <boost/algorithm/string.hpp> int _tmain(int argc, _TCHAR* argv[]) { std::wcout.imbue(std::locale("chs")); // 待分割的字符串 std::wstring strTag = _T("I Come from China"); std::vector<std::wstring> vecSegTag; // boost::is_any_of这里相当于分割规则了 boost::split(vecSegTag, strTag,boost::is_any_of(_T(" ,,"))); for (size_t i =0;i<vecSegTag.size();i++) { std::wcout<<vecSegTag[i]<<std::endl; } vecSegTag.clear(); std::wstring strTag2 = _T("我叫小明,你呢,今天天气不错"); boost::split(vecSegTag, strTag2, boost::is_any_of(_T(" ,,"))); for (size_t i =0;i<vecSegTag.size();i++) { std::wcout<<vecSegTag[i]<<std::endl; } getchar(); return 0; }




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值