前言
几乎所有有用的程序都会涉及到某些文本处理,不管是解析数据还是产生输出,比如提取字符串,搜索,替换以及解析等。大部分的问题都能简单的调用字符串的内建方法完成。但是,一些更为复杂的操作可能需要正则表达式或者强大的解析器,以下为总结的一些字符串和文本的处理方法。
1. 删除字符串中不需要的字符
如何去掉文本字符串开头,结尾或者中间不想要的字符,比如空白
strip() 方法能用于删除开始或结尾的字符。 lstrip() 和 rstrip() 分别从左和从右执行删除操作。默认情况下,这些方法会去除空白字符,但是你也可以指定其他字符。
>>> s = ' hello world \n'
>>> s.strip() #去掉首尾的字符
'hello world'
>>> s.lstrip() #去掉开头的空字符
'hello world \n'
>>> s.rstrip() #去掉结尾的空字符
' hello world'
>>>
>>> t = '-----hello====='
>>> t.lstrip('-') #去掉开头的-
'hello====='
>>> t.strip('-=')#去掉-和=
'hello'
strip() 方法在读取和清理数据以备后续处理的时候是经常会被用到的。比如,你可以用它们来去掉空格,引号和完成其他任务,当然,strip()去除操作不会对字符串的中间的文本产生任何影响
>>> s = ' hello world \n'
>>> s = s.strip()
>>> s
'hello world'
2. 字符串对齐
如何通过某种对齐方式来格式化字符串
对于基本的字符串对齐操作,可以使用字符串的 ljust() , rjust() 和 center()方法。示例如下:
>>> text = 'Hello World'
>>> text.ljust(20)
'Hello World '
>>> text.rjust(20)
' Hello World'
>>> text.center(20)
' Hello World '
>>>
这个方法也可以接受自定义的填充字符,比如&#