分割字符串应该是一种非常常用的功能
c语言中提供了strtok函数,但是c++标准库中偏偏没有
虽然实现这个功能并不困难,但如果有标准的,谁会自己去写各种乱七八糟的实现呢
关于这个问题,cplusplus.com有一篇专门讨论它的专题
www.cplusplus.com/faq/sequences/strings/split/
这里面提到了几种实现和使用方法
因为平时不使用boost库,所以就来看看c++的实现和Qt实现的使用
c++流的实现来自Jonathan Boccara's blog 点击打开链接
先来看看Qt的QString::split,使用非常方便,输出到一个QStringList
QString text = "Let,me,split,this,into,words";
auto start_timepoint = std::chrono::system_clock::now();
for (int i = 0; i < 100000; ++i) {
QStringList sl = text.split(',');
}
auto end_timepoint = std::chrono::system_clock::now();
qDebug() << std::chrono::duration_cast<std::chrono::milliseconds>(end_timepoint - start_timepoint).count();
在我的机器上输出一般是在700毫秒左右
来试试c++标准库中提供的iostreams和getline配合使用
std::string str;
for (int i = 0; i < 100000; ++i) {
std::istringstream iss(text);
std::vector<std::string> results;
while (!iss.eof()) {
getline(iss, str, ',');
results.push_back(str);
}
}
也来测一下时间,2400毫秒左右,也太差了点吧
来,在push_back的地方加上std::move,肯定是没有优化的原因
加上后,效果非常明显,提高到了2350毫秒左右,看来这玩意效率不行啊
现在请出Jonathan Boccara博客里面更为高大上的实现,原理也是流和getline的配合使用,使用了iterator貌似更符合stl的使用习惯
template<char delimiter>
class WordDelimitedBy : public std::string
{};
template<char delimiter>
std::istream& operator>>(std::istream& is, WordDelimitedBy<delimiter>& output) {
return std::getline(is, output, delimiter);
}
for (int i = 0; i < 100000; ++i) {
std::istringstream iss(text);
std::vector<std::string> results((std::istream_iterator<WordDelimitedBy<','>>(iss)),
std::istream_iterator<WordDelimitedBy<','>>());
}
继续测时间,3000毫秒,越来越慢了
再试试c++中最直观的解决方法std::string的find和substr
std::vector<std::string> splitString(const std::string &str, char delimiter)
{
std::vector<std::string> vec;
std::string::size_type start_pos = 0;
std::string::size_type end_pos = str.find(delimiter);
while(end_pos != std::string::npos) {
vec.push_back(str.substr(start_pos, end_pos - start_pos));
start_pos = end_pos + 1;
end_pos = str.find(delimiter, start_pos);
}
vec.push_back(str.substr(start_pos));
return vec;
}
for (int i = 0; i < 100000; ++i) {
auto results = splitString(text, ',');
}
850毫秒左右,和QString的split差得不太多
Qt的实现这么牛!以后就只能老老实实地用了?
再做个实验
给每个待分割的字符串加长
for (int i = 0; i < 100; ++i)
text += ",Let,me,split,this,into,words";
然后计时,开始分割1000次(这次不是100000次了)
看看现在是个什么情况?
结果有点令我吃惊!
c++流的实现在5000毫秒左右,Qt的实现在2500左右
而用string的find和substr方法的实现仅需40毫秒左右!!!
赶紧的,还等什么,用string的find和substr写个函数放那儿,万一性能不行的时候换上试试呗。

558

被折叠的 条评论
为什么被折叠?



