详细解说STL string
0 前言: string 的角色
C++ 语言是个十分优秀的语言,但优秀并不表示完美。还是有许多人不愿意使用C或者C++,为什么?原因众多,其中之一就是C/C++的文本处理功能太麻烦,用起来很不方便。以前没有接触过其他语言时,每当别人这么说,我总是不屑一顾,认为他们根本就没有领会C++的精华,或者不太懂C++,现在我接触perl, php, 和Shell脚本以后,开始理解了以前为什么有人说C++文本处理不方便了。举例来说,如果文本格式是:用户名 电话号码,文件名name.txt
Tom 23245332 Jenny 22231231 Heny 22183942 Tom 23245332 ...
那么在shell 编程中,可以这样用:
'' name.txt | sort | uniq
如果使用C/C++ 就麻烦了,他需要做以下工作:
- 先打开文件,检测文件是否打开,如果失败,则退出。
- 声明一个足够大得二维字符数组或者一个字符指针数组
- 读入一行到字符空间
- 然后分析一行的结构,找到空格,存入字符数组中。
- 关闭文件
- 写一个排序函数,或者使用写一个比较函数,使用qsort排序
- 遍历数组,比较是否有相同的,如果有,则要删除,copy...
- 输出信息
当然,有了STL,这些处理会得到很大的简化。我们可以使用 fstream来代替麻烦的fopen fread fclose, 用vector 来代替数组。最重要的是用 string来代替char * 数组,使用sort排序算法来排序,用unique 函数来去重。听起来好像很不错
。看看下面代码(例程1):
<string>
<iostream>
<algorithm>
<vector>
<fstream>
std;
main(){
ifstream in("");
string strtmp;
vector<string> vect;
(getline(in, strtmp, '/n'))
vect.push_back(strtmp.substr(0, strtmp.find(' ')));
sort(vect.begin(), vect.end());
vector<string>::iterator it=unique(vect.begin(), vect.end());
copy(vect.begin(), it, ostream_iterator<string>(cout, ""));
0;
}
当然,在这个文本格式中,不用vector而使用map会更有扩充性,例如,还可通过人名找电话号码等等,但是使用了map就不那么好用sort了。你可以用map试一试。
这里string的作用不只是可以存储字符串,还可以提供字符串的比较,查找等。在sort和unique函数中就默认使用了less<string> 和equal_to<string>函数, 上面的一段代码,其实使用了string的以下功能: <ol> <li>存储功能,在getline() 函数中 </li> <li>查找功能,在find() 函数中 </li> <li>子串功能,在substr() 函数中 </li> <li>string operator < , 默认在sort() 函数中调用 </li> <li>string operator == , 默认在unique() 函数中调用 </li> </ol> <p>总之,有了string 后,C++的字符文本处理功能总算得到了一定补充,加上配合STL其他容器使用,其在文本处理上的功能已经与perl, shell, php的距离缩小很多了。 因此掌握string 会让你的工作事半功倍。 </p> <p> </p> <h3> <a name="1%20string%20%E4%BD%BF%E7%94%A8"></a>1 string 使用 </h3>其实,string并不是一个单独的容器,只是basic_string 模板类的一个typedef 而已,相对应的还有wstring, 你在string 头文件中你会发现下面的代码: <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px"><font color="brown">extern</font> "<font color="blue">C++</font>" { <font color="brown">typedef</font> basic_string <<font color="brown">char</font>> string; <font color="brown">typedef</font> basic_string <wchar_t> wstring; } <font color="green">// extern "C++"</font></pre></pre></div> </div>由于只是解释string的用法,如果没有特殊的说明,本文并不区分string 和 basic_string的区别。 <p>string 其实相当于一个保存字符的序列容器,因此除了有字符串的一些常用操作以外,还有包含了所有的序列容器的操作。字符串的常用操作包括:增加、删除、修改、查找比较、链接、输入、输出等。详细函数列表参看<a class="twikiCurrentTopicLink twikiAnchorLink" href="http://www.stlchina.org/twiki/bin/view.pl/Main/STLDetailString#FuncList"><font color="#0000ff"><u>附录</u></font></a>。不要害怕这么多函数,其实有许多是序列容器带有的,平时不一定用的上。 </p> <p>如果你要想了解所有函数的详细用法,你需要查看<a class="twikiLink" href="http://www.stlchina.org/twiki/bin/view.pl/Main/STLBasicString"><font color="#0000ff"><u>basic_string</u></font></a>,或者下载<a href="http://stl.winterxy.com/html/000035.html" target="_top"><font color="#0000ff"><u>STL编程手册</u></font></a>。这里通过实例介绍一些常用函数。 </p> <h4> <a name="1.1%20%E5%85%85%E5%88%86%E4%BD%BF%E7%94%A8string%20%E6%93%8D%E4%BD%9C%E7%AC%A6"></a>1.1 充分使用string 操作符 </h4>string 重载了许多操作符,包括 +, +=, <, <code><font face="新宋体">=, </font></code>, [], <<, >>等,正式这些操作符,对字符串操作非常方便。先看看下面这个例子:tt.cpp(例程2) <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px"><font color="navy">#include</font> <string> <font color="navy">#include</font> <iostream> <font color="brown">using</font> <font color="brown">namespace</font> std; <font color="brown">int</font> main(){ string strinfo="<font color="blue">Please input your name:</font>"; cout << strinfo ; cin >> strinfo; <font color="brown">if</font>( strinfo == "<font color="blue">winter</font>" ) cout << "<font color="blue">you are winter!</font>"<<endl; <font color="brown">else</font> <font color="brown">if</font>( strinfo != "<font color="blue">wende</font>" ) cout << "<font color="blue">you are not wende!</font>"<<endl; <font color="brown">else</font> <font color="brown">if</font>( strinfo < "<font color="blue">winter</font>") cout << "<font color="blue">your name should be ahead of winter</font>"<<endl; <font color="brown">else</font> cout << "<font color="blue">your name should be after of winter</font>"<<endl; strinfo += "<font color="blue"> , Welcome to China!</font>"; cout << strinfo<<endl; cout <<"<font color="blue">Your name is :</font>"<<endl; string strtmp = "<font color="blue">How are you? </font>" + strinfo; <font color="brown">for</font>(<font color="brown">int</font> i = 0 ; i < strtmp.size(); i ++) cout<<strtmp[i]; <font color="brown">return</font> 0; } </pre></pre></div> </div> <p>下面是程序的输出 </p> <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px">-bash-2.05b$ make tt c++ -O -pipe -march=pentiumpro tt.cpp <font color="purple">-o</font> tt -bash-2.05b$ ./tt Please input your name:Hero you are not wende! Hero , Welcome to China! How are you? Hero , Welcome to China!</pre></pre></div> </div> <p>有了这些操作符,在STL中仿函数都可以直接使用string作为参数,例如 less, great, equal_to 等,因此在把string作为参数传递的时候,它的使用和int 或者float等已经没有什么区别了。例如,你可以使用: </p> <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px">map<string, <font color="brown">int</font>> mymap; <font color="green">//以上默认使用了 less<string></font></pre></pre></div> </div>有了 operator + 以后,你可以直接连加,例如: <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px">string strinfo="<font color="blue">Winter</font>"; string strlast="<font color="blue">Hello </font>" + strinfo + "<font color="blue">!</font>"; <font color="green">//你还可以这样:</font> string strtest="<font color="blue">Hello </font>" + strinfo + "<font color="blue"> Welcome</font>" + "<font color="blue"> to China</font>" + "<font color="blue"> !</font>";</pre></pre></div> </div>看见其中的特点了吗?只要你的等式里面有一个 string 对象,你就可以一直连续"+",但有一点需要保证的是,在开始的两项中,必须有一项是 string 对象。其原理很简单: <ol> <li>系统遇到"+"号,发现有一项是string 对象。 </li> <li>系统把另一项转化为一个临时 string 对象。 </li> <li>执行 operator + 操作,返回新的临时string 对象。 </li> <li>如果又发现"+"号,继续第一步操作。 </li> </ol>由于这个等式是由左到右开始检测执行,如果开始两项都是const char* ,程序自己并没有定义两个const char* 的加法,编译的时候肯定就有问题了。 <p>有了操作符以后,assign(), append(), compare(), at()等函数,除非有一些特殊的需求时,一般是用不上。当然at()函数还有一个功能,那就是检查下标是否合法,如果是使用: </p> <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px">string str="<font color="blue">winter</font>"; <font color="green">//下面一行有可能会引起程序中断错误</font> str[100]='!'; <font color="green">//下面会抛出异常:throws: out_of_range</font> cout<<str.at(100)<<endl;</pre></pre></div> </div>了解了吗?如果你希望效率高,还是使用[]来访问,如果你希望稳定性好,最好使用at()来访问。 <h4> <a name="1.2%20%E7%9C%BC%E8%8A%B1%E7%BC%AD%E4%B9%B1%E7%9A%84string%20find%20%E5%87%BD%E6%95%B0"></a>1.2 眼花缭乱的string find 函数 </h4>由于查找是使用最为频繁的功能之一,string 提供了非常丰富的查找函数。其列表如下: <table class="twikiTable" style="BORDER-TOP-WIDTH: 0px; BORDER-LEFT-WIDTH: 0px; BORDER-BOTTOM-WIDTH: 0px; BORDER-RIGHT-WIDTH: 0px" cellspacing="1" cellpadding="1" border="0"><tbody> <tr class="twikiTableEven"> <td class="twikiFirstCol" align="middle" bgcolor="#eaeaea">函数名 </td> <td align="middle" bgcolor="#eaeaea">描述 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">find </td> <td bgcolor="#ffffff">查找 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">rfind </td> <td bgcolor="#eaeaea">反向查找 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">find_first_of </td> <td bgcolor="#ffffff">查找包含子串中的任何字符,返回第一个位置 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">find_first_not_of </td> <td bgcolor="#eaeaea">查找不包含子串中的任何字符,返回第一个位置 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">find_last_of </td> <td bgcolor="#ffffff">查找包含子串中的任何字符,返回最后一个位置 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol twikiLast" bgcolor="#eaeaea">find_last_not_of </td> <td class="twikiLast" bgcolor="#eaeaea">查找不包含子串中的任何字符,返回最后一个位置 </td> </tr> </tbody></table>以上函数都是被重载了4次,以下是以find_first_of 函数为例说明他们的参数,其他函数和其参数一样,也就是说总共有24个函数 <img title="smile" alt="smile" src="http://www.stlchina.org/twiki/pub/TWiki/SmiliesPlugin/smile.gif" border="0"> : <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px">size_type find_first_of(<font color="brown">const</font> basic_string& s, size_type pos = 0) size_type find_first_of(<font color="brown">const</font> charT* s, size_type pos, size_type n) size_type find_first_of(<font color="brown">const</font> charT* s, size_type pos = 0) size_type find_first_of(charT c, size_type pos = 0)</pre></pre></div> </div>所有的查找函数都返回一个size_type类型,这个返回值一般都是所找到字符串的位置,如果没有找到,则返回string::npos。有一点需要特别注意,所有和string::npos的比较一定要用string::size_type来使用,不要直接使用int 或者unsigned int等类型。其实string::npos表示的是-1, 看看头文件: <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px"><font color="brown">template</font> <<font color="brown">class</font> _CharT, <font color="brown">class</font> _Traits, <font color="brown">class</font> _Alloc> <font color="brown">const</font> basic_string<_CharT,_Traits,_Alloc>::size_type basic_string<_CharT,_Traits,_Alloc>::npos = basic_string<_CharT,_Traits,_Alloc>::size_type) -1;</pre></pre></div> </div> <p>find 和 rfind 都还比较容易理解,一个是正向匹配,一个是逆向匹配,后面的参数pos都是用来指定起始查找位置。对于find_first_of 和find_last_of 就不是那么好理解。 </p> <p>find_first_of 是给定一个要查找的字符集,找到这个字符集中任何一个字符所在字符串中第一个位置。或许看一个例子更容易明白。 </p> <p>有这样一个需求:过滤一行开头和结尾的所有非英文字符。看看用string 如何实现: </p> <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px"><font color="navy">#include</font> <string> <font color="navy">#include</font> <iostream> <font color="brown">using</font> <font color="brown">namespace</font> std; <font color="brown">int</font> main(){ string strinfo="<font color="blue"> //*---Hello Word!......------</font>"; string strset="<font color="blue">ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz</font>"; <font color="brown">int</font> first = strinfo.find_first_of(strset); <font color="brown">if</font>(first == string::npos) { cout<<"<font color="blue">not find any characters</font>"<<endl; <font color="brown">return</font> -1; } <font color="brown">int</font> last = strinfo.find_last_of(strset); <font color="brown">if</font>(last == string::npos) { cout<<"<font color="blue">not find any characters</font>"<<endl; <font color="brown">return</font> -1; } cout << strinfo.substr(first, last - first + 1)<<endl; <font color="brown">return</font> 0; }</pre></pre></div> </div>这里把所有的英文字母大小写作为了需要查找的字符集,先查找第一个英文字母的位置,然后查找最后一个英文字母的位置,然后用substr 来的到中间的一部分,用于输出结果。下面就是其结果: <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px">Hello Word</pre></pre></div> </div>前面的符号和后面的符号都没有了。像这种用法可以用来查找分隔符,从而把一个连续的字符串分割成为几部分,达到 shell 命令中的 awk 的用法。特别是当分隔符有多个的时候,可以一次指定。例如有这样的需求: <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px">张三|3456123, 湖南 李四,4564234| 湖北 王小二, 4433253|北京 ...</pre></pre></div> </div>我们需要以 "|" ","为分隔符,同时又要过滤空格,把每行分成相应的字段。可以作为你的一个家庭作业来试试,要求代码简洁。 <h4> <a name="1.3%20string%20insert,%20replace,%20eras"></a>1.3 string insert, replace, erase </h4>了解了string 的操作符,查找函数和substr,其实就已经了解了string的80%的操作了。insert函数, replace函数和erase函数在使用起来相对简单。下面以一个例子来说明其应用。 <p>string只是提供了按照位置和区间的replace函数,而不能用一个string字串来替换指定string中的另一个字串。这里写一个函数来实现这个功能: </p> <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px"><font color="brown">void</font> string_replace(string & strBig, <font color="brown">const</font> string & strsrc, <font color="brown">const</font> string &strdst) { string::size_type pos=0; string::size_type srclen=strsrc.size(); string::size_type dstlen=strdst.size(); <font color="brown">while</font>( (pos=strBig.find(strsrc, pos)) != string::npos){ strBig.replace(pos, srclen, strdst); pos += dstlen; } }</pre></pre></div> </div>看看如何调用: <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px"><font color="navy">#include</font> <string> <font color="navy">#include</font> <iostream> <font color="brown">using</font> <font color="brown">namespace</font> std; <font color="brown">int</font> main() { string strinfo="<font color="blue">This is Winter, Winter is a programmer. Do you know Winter?</font>"; cout<<"<font color="blue">Orign string is :/n</font>"<<strinfo<<endl; string_replace(strinfo, "<font color="blue">Winter</font>", "<font color="blue">wende</font>"); cout<<"<font color="blue">After replace Winter with wende, the string is :/n</font>"<<strinfo<<endl; <font color="brown">return</font> 0; }</pre></pre></div> </div>其输出结果: <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px">Orign string is : This is Winter, Winter is a programmer. Do you know Winter? After replace Winter with wende, the string is : This is wende, wende is a programmer. Do you know wende?</pre></pre></div> </div>如果不用replace函数,则可以使用erase和insert来替换,也能实现string_replace函数的功能: <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px"><font color="brown">void</font> string_replace(string & strBig, <font color="brown">const</font> string & strsrc, <font color="brown">const</font> string &strdst) { string::size_type pos=0; string::size_type srclen=strsrc.size(); string::size_type dstlen=strdst.size(); <font color="brown">while</font>( (pos=strBig.find(strsrc, pos)) != string::npos){ strBig.erase(pos, srclen); strBig.insert(pos, strdst); pos += dstlen; } }</pre></pre></div> </div>当然,这种方法没有使用replace来得直接。 <h3> <a name="2%20string%20%E5%92%8C%20C%E9%A3%8E%E6%A0%BC%E5%AD%97%E7%AC%A6%E4%B8%B2"></a>2 string 和 C风格字符串 </h3>现在看了这么多例子,发现const char* 可以和string 直接转换,例如我们在上面的例子中,使用 <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px">string_replace(strinfo, "<font color="blue">Winter</font>", "<font color="blue">wende</font>");</pre></pre></div> </div>来代用 <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px"><font color="brown">void</font> string_replace(string & strBig, <font color="brown">const</font> string & strsrc, <font color="brown">const</font> string &strdst) </pre></pre></div> </div>在C语言中只有char* 和 const char*,为了使用起来方便,string提供了三个函数满足其要求: <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px"><font color="brown">const</font> charT* c_str() <font color="brown">const</font> <font color="brown">const</font> charT* data() <font color="brown">const</font> size_type copy(charT* buf, size_type n, size_type pos = 0) <font color="brown">const</font> </pre></pre></div> </div>其中: <ol> <li>c_str 直接返回一个以/0结尾的字符串。 </li> <li>data 直接以数组方式返回string的内容,其大小为size()的返回值,结尾并没有/0字符。 </li> <li>copy 把string的内容拷贝到buf空间中。 </li> </ol>你或许会问,c_str()的功能包含data(),那还需要data()函数干什么?看看源码: <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px"><font color="brown">const</font> charT* c_str () <font color="brown">const</font> { <font color="brown">if</font> (length () == 0) <font color="brown">return</font> "<font color="blue"></font>"; terminate (); <font color="brown">return</font> data (); }</pre></pre></div> </div>原来c_str()的流程是:先调用terminate(),然后在返回data()。因此如果你对效率要求比较高,而且你的处理又不一定需要以/0的方式结束,你最好选择data()。但是对于一般的C函数中,需要以const char*为输入参数,你就要使用c_str()函数。 <p>对于c_str() data()函数,返回的数组都是由string本身拥有,千万不可修改其内容。其原因是许多string实现的时候采用了引用机制,也就是说,有可能几个string使用同一个字符存储空间。而且你不能使用sizeof(string)来查看其大小。详细的解释和实现查看<a href="http://stl.winterxy.com/html/000030.html" target="_top"><font color="#0000ff"><u>Effective STL</u></font></a>的条款15:<a href="http://stl.winterxy.com/html/item_15.html" target="_top"><font color="#0000ff"><u>小心string实现的多样性</u></font></a>。 </p> <p>另外在你的程序中,只在需要时才使用c_str()或者data()得到字符串,每调用一次,下次再使用就会失效,如: </p> <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px">string strinfo("<font color="blue">this is Winter</font>"); ... <font color="green">//最好的方式是:</font> foo(strinfo.c_str()); <font color="green">//也可以这么用:</font> <font color="brown">const</font> <font color="brown">char</font>* pstr=strinfo.c_str(); foo(pstr); <font color="green">//不要再使用了pstr了, 下面的操作已经使pstr无效了。</font> strinfo += "<font color="blue"> Hello!</font>"; foo(pstr);<font color="green">//错误!</font></pre></pre></div> </div>会遇到什么错误?当你幸运的时候pstr可能只是指向"this is Winter Hello!"的字符串,如果不幸运,就会导致程序出现其他问题,总会有一些不可遇见的错误。总之不会是你预期的那个结果。 <p> </p> <h3> <a name="3%20string%20%E5%92%8C%20Charactor%20Traits"></a>3 string 和 Charactor Traits </h3>了解了string的用法,该详细看看string的真相了。前面提到string 只是basic_string的一个typedef。看看basic_string 的参数: <div class="BeautifierPlugin"> <div class="fragment"><pre style="PADDING-BOTTOM: 0px"><pre style="PADDING-BOTTOM: 0px"><font color="brown">template</font> <<font color="brown">class</font> charT, <font color="brown">class</font> traits = char_traits<charT>, <font color="brown">class</font> Allocator = allocator<charT> > <font color="brown">class</font> basic_string { <font color="green">//...</font> }</pre></pre></div> </div>char_traits不仅是在basic_string 中有用,在basic_istream 和 basic_ostream中也需要用到。 <p>就像Steve Donovan在<a href="http://www.stlchina.org/twiki/bin/view.pl/Main/STLOverdoTemplates" target="_top"><font color="#0000ff"><u>过度使用C++模板</u></font></a>中提到的,这些确实有些过头了,要不是系统自己定义了相关的一些属性,而且用了个typedef,否则还真不知道如何使用。 </p> <p>但复杂总有复杂道理。有了char_traits,你可以定义自己的字符串类型。当然,有了char_traits < char > 和char_traits < wchar_t > 你的需求使用已经足够了,为了更好的理解string ,咱们来看看char_traits都有哪些要求。 </p> <p>如果你希望使用你自己定义的字符,你必须定义包含下列成员的结构: </p> <table class="twikiTable" style="BORDER-TOP-WIDTH: 0px; BORDER-LEFT-WIDTH: 0px; BORDER-BOTTOM-WIDTH: 0px; BORDER-RIGHT-WIDTH: 0px" cellspacing="1" cellpadding="1" border="0"><tbody> <tr class="twikiTableEven"> <th class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#dadada" maxcols="2"> <a title="Sort by this column" style="COLOR: #000000" href="http://www.stlchina.org/twiki/bin/view.pl/Main/STLDetailString?sortcol=0;table=2;up=1#sorted_table" rel="nofollow"><u>表达式</u></a><a name="sorted_table"><!-- --></a><span title="Sorted ascending"><span class="tableSortIcon tableSortUp"><u><img alt="up" src="http://www.stlchina.org/twiki/pub/TWiki/TablePlugin/up.gif"></u></span></span> </th> <th align="middle" bgcolor="#dadada" maxcols="2"> <a title="Sort by this column" style="COLOR: #000000" href="http://www.stlchina.org/twiki/bin/view.pl/Main/STLDetailString?sortcol=1;table=2;up=0#sorted_table" rel="nofollow"><u>描述</u></a> </th> </tr> <tr class="twikiTableOdd"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#eaeaea">assign(c1,c2) </td> <td bgcolor="#eaeaea">把字符c2赋值给c1 </td> </tr> <tr class="twikiTableEven"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#ffffff">assign(s,n,c) </td> <td bgcolor="#ffffff">把s中的前n个字符赋值为c </td> </tr> <tr class="twikiTableOdd"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#eaeaea">char_type </td> <td bgcolor="#eaeaea">字符类型 </td> </tr> <tr class="twikiTableEven"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#ffffff">compare(s1,s2,n) </td> <td bgcolor="#ffffff">比较s1和s2的前n个字符 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#eaeaea">copy(s1,s2, n) </td> <td bgcolor="#eaeaea">把s2的前n个字符拷贝到s1中 </td> </tr> <tr class="twikiTableEven"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#ffffff">eof() </td> <td bgcolor="#ffffff">返回end-of-file </td> </tr> <tr class="twikiTableOdd"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#eaeaea">eq(c1,c2) </td> <td bgcolor="#eaeaea">判断c1,c2 是否相等 </td> </tr> <tr class="twikiTableEven"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#ffffff">eq_int_type(i1,i2) </td> <td bgcolor="#ffffff">判断i1和i2是否相等 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#eaeaea">find(s,n,c) </td> <td bgcolor="#eaeaea">在s的前n个字符内查找c </td> </tr> <tr class="twikiTableEven"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#ffffff">int_type </td> <td bgcolor="#ffffff">int 类型 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#eaeaea">length(str) </td> <td bgcolor="#eaeaea">判断str的长度 </td> </tr> <tr class="twikiTableEven"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#ffffff">lt(c1,c2) </td> <td bgcolor="#ffffff">判断c1是否小于c2 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#eaeaea">move(s1,s2, n) </td> <td bgcolor="#eaeaea">把s2中的前n个字符移动到s1中 </td> </tr> <tr class="twikiTableEven"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#ffffff">not_eof(i) </td> <td bgcolor="#ffffff">判断i是否为EOF </td> </tr> <tr class="twikiTableOdd"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#eaeaea">off_type </td> <td bgcolor="#eaeaea">表示位置之间距离的类型 </td> </tr> <tr class="twikiTableEven"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#ffffff">pos_type </td> <td bgcolor="#ffffff">位置类型 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#eaeaea">state_type </td> <td bgcolor="#eaeaea">表示状态的类型 </td> </tr> <tr class="twikiTableEven"> <td class="twikiSortedAscendingCol twikiFirstCol" bgcolor="#ffffff">to_char_type(i) </td> <td bgcolor="#ffffff">将i转换成char_type </td> </tr> <tr class="twikiTableOdd"> <td class="twikiSortedAscendingCol twikiFirstCol twikiLast" bgcolor="#eaeaea">to_int_type(c) </td> <td class="twikiLast" bgcolor="#eaeaea">将c转换成int_type </td> </tr> </tbody></table>想看看实际的例子,你可以看看sgi STL的<a href="http://www.stlchina.org/stl_doc/char_traits.h" target="_top"><font color="#0000ff"><u>char_traits结构源码</u></font></a>. <p>现在默认的string版本中,并不支持忽略大小写的比较函数和查找函数,如果你想练练手,你可以试试改写一个char_traits , 然后生成一个case_string类, 也可以在string 上做继承,然后派生一个新的类,例如:ext_string,提供一些常用的功能,例如: </p> <ol> <li>定义分隔符。给定分隔符,把string分为几个字段。 </li> <li>提供替换功能。例如,用winter, 替换字符串中的wende </li> <li>大小写处理。例如,忽略大小写比较,转换等 </li> <li>整形转换。例如把"123"字符串转换为123数字。 </li> </ol>这些都是常用的功能,如果你有兴趣可以试试。其实有人已经实现了,看看<a href="http://www.gotroot.ca/ext_string/" target="_top"><font color="#0000ff"><u>Extended STL string</u></font></a>。如果你想偷懒,下载一个头文件就可以用,有了它确实方便了很多。要是有人能提供一个支持正则表达式的string,我会非常乐意用。 <p> </p> <h3> <a name="4%20string%20%E5%BB%BA%E8%AE%AE"></a>4 string 建议 </h3>使用string 的方便性就不用再说了,这里要重点强调的是string的安全性。 <ol> <li>string并不是万能的,如果你在一个大工程中需要频繁处理字符串,而且有可能是多线程,那么你一定要慎重(当然,在多线程下你使用任何STL容器都要慎重)。 </li> <li>string的实现和效率并不一定是你想象的那样,如果你对大量的字符串操作,而且特别关心其效率,那么你有两个选择,首先,你可以看看你使用的STL版本中string实现的源码;另一选择是你自己写一个只提供你需要的功能的类。 </li> <li>string的c_str()函数是用来得到C语言风格的字符串,其返回的指针不能修改其空间。而且在下一次使用时重新调用获得新的指针。 </li> <li>string的data()函数返回的字符串指针不会以'/0'结束,千万不可忽视。 </li> <li>尽量去使用操作符,这样可以让程序更加易懂(特别是那些脚本程序员也可以看懂) </li> </ol> <h3> <a name="5%20%E5%B0%8F%E7%BB%93"></a>5 小结 </h3>难怪有人说:<br><strong>string 使用方便功能强,我们一直用它!</strong> <p> </p> <h3> <a name="6%20%E9%99%84%E5%BD%95"></a>6 附录 </h3> <a name="FuncList"></a>string 函数列表 <table class="twikiTable" style="BORDER-TOP-WIDTH: 0px; BORDER-LEFT-WIDTH: 0px; BORDER-BOTTOM-WIDTH: 0px; BORDER-RIGHT-WIDTH: 0px" cellspacing="1" cellpadding="1" border="0"><tbody> <tr class="twikiTableEven"> <td class="twikiFirstCol" align="middle" bgcolor="#eaeaea">函数名 </td> <td align="middle" bgcolor="#eaeaea">描述 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">begin </td> <td bgcolor="#ffffff">得到指向字符串开头的Iterator </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">end </td> <td bgcolor="#eaeaea">得到指向字符串结尾的Iterator </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">rbegin </td> <td bgcolor="#ffffff">得到指向反向字符串开头的Iterator </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">rend </td> <td bgcolor="#eaeaea">得到指向反向字符串结尾的Iterator </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">size </td> <td bgcolor="#ffffff">得到字符串的大小 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">length </td> <td bgcolor="#eaeaea">和size函数功能相同 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">max_size </td> <td bgcolor="#ffffff">字符串可能的最大大小 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">capacity </td> <td bgcolor="#eaeaea">在不重新分配内存的情况下,字符串可能的大小 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">empty </td> <td bgcolor="#ffffff">判断是否为空 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">operator[] </td> <td bgcolor="#eaeaea">取第几个元素,相当于数组 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">c_str </td> <td bgcolor="#ffffff">取得C风格的const char* 字符串 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">data </td> <td bgcolor="#eaeaea">取得字符串内容地址 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">operator= </td> <td bgcolor="#ffffff">赋值操作符 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">reserve </td> <td bgcolor="#eaeaea">预留空间 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">swap </td> <td bgcolor="#ffffff">交换函数 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">insert </td> <td bgcolor="#eaeaea">插入字符 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">append </td> <td bgcolor="#ffffff">追加字符 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">push_back </td> <td bgcolor="#eaeaea">追加字符 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">operator+= </td> <td bgcolor="#ffffff">+= 操作符 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">erase </td> <td bgcolor="#eaeaea">删除字符串 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">clear </td> <td bgcolor="#ffffff">清空字符容器中所有内容 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">resize </td> <td bgcolor="#eaeaea">重新分配空间 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">assign </td> <td bgcolor="#ffffff">和赋值操作符一样 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">replace </td> <td bgcolor="#eaeaea">替代 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">copy </td> <td bgcolor="#ffffff">字符串到空间 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">find </td> <td bgcolor="#eaeaea">查找 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">rfind </td> <td bgcolor="#ffffff">反向查找 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">find_first_of </td> <td bgcolor="#eaeaea">查找包含子串中的任何字符,返回第一个位置 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">find_first_not_of </td> <td bgcolor="#ffffff">查找不包含子串中的任何字符,返回第一个位置 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">find_last_of </td> <td bgcolor="#eaeaea">查找包含子串中的任何字符,返回最后一个位置 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">find_last_not_of </td> <td bgcolor="#ffffff">查找不包含子串中的任何字符,返回最后一个位置 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">substr </td> <td bgcolor="#eaeaea">得到字串 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">compare </td> <td bgcolor="#ffffff">比较字符串 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">operator+ </td> <td bgcolor="#eaeaea">字符串链接 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">operator== </td> <td bgcolor="#ffffff">判断是否相等 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">operator!= </td> <td bgcolor="#eaeaea">判断是否不等于 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">operator< </td> <td bgcolor="#ffffff">判断是否小于 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol" bgcolor="#eaeaea">operator>> </td> <td bgcolor="#eaeaea">从输入流中读入字符串 </td> </tr> <tr class="twikiTableOdd"> <td class="twikiFirstCol" bgcolor="#ffffff">operator<< </td> <td bgcolor="#ffffff">字符串写入输出流 </td> </tr> <tr class="twikiTableEven"> <td class="twikiFirstCol twikiLast" bgcolor="#eaeaea">getline </td> <td class="twikiLast" bgcolor="#eaeaea">从输入流中读入一行 </td> </tr> </tbody></table></string></string>
本文深入讲解C++ STL库中的string类用法,包括操作符、查找函数、插入替换删除等功能,探讨string与C风格字符串及Charactor Traits的关系,并提出使用建议。
405

被折叠的 条评论
为什么被折叠?



