[转载]高手戏玩c++(1)

本文介绍了一系列C++标准库中处理字符串的实用技巧,包括大小写转换、修剪、替换、分割等操作,并展示了如何利用STL算法简化这些任务。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

toupper,tolower
地球人都知道C++的string没有toupper,好在这不是个大问题,因为我们有STL算法:

strings("heLLo");
transform(s.begin(),s.end(),s.begin(),::toupper);
cout<<s<<endl;
transform(s.begin(),s.end(),s.begin(),::tolower);
cout<<s<<endl;

当然,我知道很多人希望的是s.to_upper(),但是对于一个这么通用的basic_string来说,的确没办法把这些专有的方法放进来。如果你用booststringalgo,那当然不在话下,你也就不需要读这篇文章了。

------------------------------------------------------------------------
trim
我们还知道string没有trim,不过自力更生也不困难,比toupper来的还要简单:

strings("hello");
s.erase(0,s.find_first_not_of("/n"));
cout<<s<<endl;
s.erase(s.find_last_not_of('')+1);
cout<<s<<endl;

注意由于find_first_not_of和find_last_not_of都可以接受字符串,这个时候它们寻找该字符串中所有字符的absence,所以你可以一次trim掉多种字符。

-----------------------------------------------------------------------
erase
string本身的erase还是不错的,但是只能erase连续字符,如果要拿掉一个字符串里面所有的某个字符呢?用STL的erase+remove_if就可以了,注意光remove_if是不行的。

strings("hello,world.saybye");
s.erase(remove_if(s.begin(),s.end(),
bind2nd(equal_to<char>(),'')),
s.end());

上面的这段会拿掉所有的空格,于是得到hello,world.saybye。

-----------------------------------------------------------------------
replace
string本身提供了replace,不过并不是面向字符串的,譬如我们最常用的把一个substr换成另一个substr的操作,就要做一点小组合:

strings("hello,world");
stringsub("ello,");
s.replace(s.find(sub),sub.size(),"appy");
cout<<s<<endl;

输出为happyworld。注意原来的那个substr和替换的substr并不一定要一样长。

-----------------------------------------------------------------------
startwith,endwith
这两个可真常用,不过如果你仔细看看string的接口,就会发现其实没必要专门提供这两个方法,已经有的接口可以干得很好:

strings("hello,world");
stringhead("hello");
stringtail("ld");
boolstartwith=s.compare(0,head.size(),head)==0;
cout<<boolalpha<<startwith<<endl;
boolendwith=s.compare(s.size()-tail.size(),tail.size(),tail)==0;
cout<<boolalpha<<endwith<<endl;

当然了,没有s.startwith("hello")这样方便。

------------------------------------------------------------------------
toint,todouble,tobool...
这也是老生常谈了,无论是C的方法还是C++的方法都可以,各有特色:

strings("123");
inti=atoi(s.c_str());
cout<<i<<endl;

intii;
stringstream(s)>>ii;
cout<<ii<<endl;

stringsd("12.3");
doubled=atof(sd.c_str());
cout<<d<<endl;

doubledd;
stringstream(sd)>>dd;
cout<<dd<<endl;

stringsb("true");
boolb;
stringstream(sb)>>boolalpha>>b;
cout<<boolalpha<<b<<endl;

C的方法很简洁,而且赋值与转换在一句里面完成,而C++的方法很通用。

------------------------------------------------------------------------
split
这可是件麻烦事,我们最希望的是这样一个接口:s.split(vect,',')。用STL算法来做有一定难度,我们可以从简单的开始,如果分隔符是空格、tab和回车之类,那么这样就够了:

strings("helloworld,bye.");
vector<string>vect;
vect.assign(

istream_iterator<string>(stringstream(s)),

istream_iterator<string>()

);


不过要注意,如果s很大,那么会有效率上的隐忧,因为stringstream会copy一份string给自己用。

------------------------------------------------------------------------
concat
把一个装有string的容器里面所有的string连接起来,怎么做?希望你不要说是handcode循环,这样做不是更好?

vector<string>vect;
vect.push_back("hello");
vect.push_back(",");
vect.push_back("world");

cout<<accumulate(vect.begin(),vect.end(),string(""));

不过在效率上比较有优化余地。

-------------------------------------------------------------------------

reverse
其实我比较怀疑有什么人需要真的去reverse一个string,不过做这件事情的确是很容易:

std::reverse(s.begin(),s.end());

上面是原地反转的方法,如果需要反转到别的string里面,一样简单:

s1.assign(s.rbegin(),s.rend());

效率也相当理想。

-------------------------------------------------------------------------

解析文件扩展名
字数多点的写法:

std::stringfilename("hello.exe");

std::string::size_typepos=filename.rfind('.');
std::stringext=filename.substr(pos==std::string::npos?filename.length():pos+1);

不过两行,合并成一行呢?也不是不可以:

std::stringext=filename.substr(filename.rfind('.')==std::string::npos?filename.length():filename.rfind('.')+1);

我知道,rfind执行了两次。不过第一,你可以希望编译器把它优化掉,其次,扩展名一般都很短,即便多执行一次,区别应该是相当微小。
STL算法
distance
很多时候我们希望在一个vector,或者list,或者什么其他东西里面,找到一个值在哪个位置,这个时候find帮不上忙,而有人就转而求助手写循环了,而且是原始的手写循环:

for(inti=0;i<vect.size();++i)
if(vect[i]==value)break;

如果编译器把i看作forscope的一部分,你还要把i的声明拿出去。真的需要这样么?看看这个:

intdist=
distance(col.begin(),
find(col.begin(),col.end(),5));

其中col可以是很多容器,list,vector,deque...当然这是你确定5就在col里面的情形,如果你不确定,那就加点判断:

intdist;
list<int>::iteratorpos=find(col.begin(),col.end(),5);
if(pos!=col.end())
dist=distance(col.begin(),pos);

我想这还是比手写循环来的好些吧。

--------------------------------------------------------------------------
max,min
这是有直接的算法支持的,当然复杂度是O(n),用于未排序容器,如果是排序容器...老兄,那还需要什么算法么?

max_element(col.begin(),col.end());
min_element(col.begin(),col.end());

注意返回的是iterator,如果你关心的只是值,那么好:

*max_element(col.begin(),col.end());
*min_element(col.begin(),col.end());

max_element和min_element都默认用less来排序,它们也都接受一个binarypredicate,如果你足够无聊,甚至可以把max_element当成min_element来用,或者反之:

*max_element(col.begin(),col.end(),greater<int>());//返回最小值!
*min_element(col.begin(),col.end(),greater<int>());//返回最大值

当然它们的本意不是这个,而是让你能在比较特殊的情况下使用它们,例如,你要比较的是每个元素的某个成员,或者成员函数的返回值。例如:

#include<iostream>
#include<list>
#include<algorithm>
#include<string>
#include<boost/bind.hpp>

usingnamespaceboost;
usingnamespacestd;

structPerson
{
Person(conststring&_name,int_age)
:name(_name),age(_age)
{}
intage;
stringname;
};

intmain()
{
list<Person>col;
list<Person>::iteratorpos;

col.push_back(Person("Tom",10));
col.push_back(Person("Jerry",12));
col.push_back(Person("Mickey",9));

Personeldest=
*max_element(col.begin(),col.end(),
bind(&Person::age,_1)<bind(&Person::age,_2));//>=1.33

cout<<eldest.name;
}

输出是Jerry,这里用了boost.bind,原谅我不知道用bind2nd,mem_fun怎么写,我也不想知道...

-------------------------------------------------------------------------
copy_if
没错,STL里面压根没有copy_if,这就是为什么我们需要这个:

template<typenameInputIterator,typenameOutputIterator,typenamePredicate>
OutputIteratorcopy_if(
InputIteratorbegin,InputIteratorend,OutputIteratordestBegin,Predicatep)
{
while(begin!=end)
{
if(p(*begin))*destBegin++=*begin;
++begin;
}
returndestBegin;
}

把它放在自己的工具箱里,是一个明智的选择。

------------------------------------------------------------------------
惯用手法:erase(iter++)
如果你要去除一个list中的某些元素,那可千万小心:(下面的代码是错的!!!)

#include<iostream>
#include<algorithm>
#include<iterator>
#include<list>

intmain()
{
intarr[]={1,2,3,4,5,6,7,8,9,10};
std::list<int>lst(arr,arr+10);

for(std::list<int>::iteratoriter=lst.begin();
iter!=lst.end();++iter)
if(*iter%2==0)
lst.erase(iter);

std::copy(lst.begin(),lst.end(),
std::ostream_iterator<int>(std::cout,""));
}

当iter被erase掉的时候,它已经失效,而后面却还会做++iter,其行为无可预期!如果你不想动用remove_if,那么唯一的选择就是:

#include<iostream>
#include<algorithm>
#include<iterator>
#include<list>

intmain()
{
intarr[]={1,2,3,4,5,6,7,8,9,10};
std::list<int>lst(arr,arr+10);

for(std::list<int>::iteratoriter=lst.begin();
iter!=lst.end();)
if(*iter%2==0)
lst.erase(iter++);
else
++iter;

std::copy(lst.begin(),lst.end(),
std::ostream_iterator<int>(std::cout,""));
}

但是上面的代码不能用于vector,string和deque,因为对于这些容器,erase不光令iter失效,还令iter之后的所有iterator失效!

-------------------------------------------------------------------------
erase(remove...)惯用手法
上面的循环如此难写,如此不通用,如此不容易理解,还是用STL算法来的好,但是注意,光remove_if是没用的,必须使用erase(remove...)惯用手法:

#include<iostream>
#include<algorithm>
#include<iterator>
#include<list>
#include<functional>
#include<boost/bind.hpp>

intmain()
{
intarr[]={1,2,3,4,5,6,7,8,9,10};
std::list<int>lst(arr,arr+10);

lst.erase(remove_if(lst.begin(),lst.end(),
boost::bind(std::modulus<int>(),_1,2)==0),
lst.end()
);

std::copy(lst.begin(),lst.end(),
std::ostream_iterator<int>(std::cout,""));
}

当然,这里借助了boost.bind,让我们不用多写一个没用的functor。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值