判断子串(成员操作符in,not in)
s = “Hello World”
“Hello” in s
True
“hello” not in s
True
“world” in s
False
拼接(连接符+)
“Hello”+“World”
‘HelloWorld’
重复(重复操作符*)
‘-’*10
‘----------’
操作符r在特殊字符后
比较(==、!=、>、<、>=、<=)
python中不像c++,有compare函数,直接使用比较运算符比较字符串即可。
“hello”==“hi”
False
“hello”!=“hi”
True
“hello”>“hi”
False
“hello”<“hi”
True
“hello”>=“hi”
False
“hello”<=“hi”
True
删除
使用关键字del,删除后不可再用,否则NameError。没必要显式删除,Python会自动处理的。
del s
s
Traceback (most recent call last):
File “”, line 1, in
NameError: name ‘s’ is not defined
格式化
%
格式化符号
符 号 | 描述 |
---|---|
%c | 格式化字符及其ASCII码 |
%s | 格式化字符串 |
%d | 格式化整数 |
%u | 格式化无符号整型 |
%o | 格式化无符号八进制数 |
%x | 格式化无符号十六进制数 |
%X | 格式化无符号十六进制数(大写) |
%f | 格式化浮点数字,可指定小数点后的精度 |
%e | 用科学计数法格式化浮点数 |
%E | 作用同%e,用科学计数法格式化浮点数 |
%g | %f和%e的简写 |
%G | %F 和 %E 的简写 |
%p | 用十六进制数格式化变量的地址 |
辅助符号
符号 | 功能 |
---|---|
* | 定义宽度或者小数点精度 |
- | 用做左对齐 |
+ | 在正数前面显示加号( + ) |
在正数前面显示空格 | |
# | 在八进制数前面显示零(‘0’),在十六进制前面显示’0x’或者’0X’(取决于用的是’x’还是’X’) |
0 | 显示的数字前面填充’0’而不是默认的空格 |
% | ‘%%‘输出一个单一的’%’ |
(var) | 映射变量(字典参数) |
m.n. | m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话) |
‘grade:%f’ % 12.345678
‘grade:12.345678’‘grade:%.2f’ % 92.2354
‘grade:92.24’‘grade:%c’ % 66
‘grade:B’‘grade:%s’ % ‘good’
‘grade:good’
更多内容,读者自行尝试吧。
f"{}"
python版本>=3.6
比上面的,以及.format()效率要高。如果你的python版本高一点,建议使用这个。
同样,格式化符号有很多,博主不再黏贴,针对数字,字符串,时间之类的都有,黏贴的话文章太长。
例如,datetime的格式化符号。
举例
代码:
from datetime import datetime
now = datetime.now()
print(f’datetime_now:{now:%F %X}')
terminal:
datetime_now:2020-09-05 09:39:15
pycharm里面敲的,不是交互式。
转义字符
转义字符
转义字符 | 描述 |
---|---|
(在行尾时) | 续行符 |
\ | 反斜杠符号 |
’ | 单引号 |
" | 双引号 |
\a | 响铃 |
\b | 退格(Backspace) |
\e | 转义 |
\000 | 空 |
\n | 换行 |
\v | 纵向制表符 |
\t | 横向制表符 |
\r | 回车 |
\f | 换页 |
\oyy | 八进制数,yy代表的字符,例如:\o12代表换行 |
\xyy | 十六进制数,yy代表的字符,例如:\x0a代表换行 |
\other | 其它的字符以普通格式输出 |
代码:
print(‘hello\nworld’)
terminal:
hello
world
原始字符串(操作符r)
这个没有放到前面的操作符中,因为在转义字符后面讲比较好。r可以使字符串里面就是字符串内容本身,没有转义等。
代码:
print(r’hello\nworld’)
terminal:
hello\nworld
在pycharm中不加r时,字符串中的\n是橘色的,加了后就是绿色了。
方法
s = ‘hello world’
type(s)
<class ‘str’>
一个字符串是类str的一个对象,也就可以调用str类的方法。
拆分
split
(sep=None, maxsplit=-1)
返回一个由字符串内单词组成的列表,使用 sep 作为分隔字符串。 如果给出了 maxsplit,则最多进行 maxsplit 次拆分(因此,列表最多会有 maxsplit+1
个元素)。 如果 maxsplit 未指定或为 -1
,则不限制拆分次数(进行所有可能的拆分)。
如果给出了 sep,则连续的分隔符不会被组合在一起而是被视为分隔空字符串 (例如 '1,,2'.split(',')
将返回 ['1', '', '2']
)。 sep 参数可能由多个字符组成 (例如 '1<>2<>3'.split('<>')
将返回 ['1', '2', '3']
)。 使用指定的分隔符拆分空字符串将返回 ['']
。
sep没给的话是默认是空格,几个空格都可以。
“hello world,i’m lady_killer”.split(‘,’)
[‘hello world’, “i’m lady_killer”]
“hello wor ld,i’m lady_killer”.split()
[‘hello’, ‘wor’, “ld,i’m”, ‘lady_killer’]
rsplit方法参数相同,不同的是从右边开始
拼接
join
(iterable)
返回一个由 iterable (可迭代的对象)中的字符串拼接而成的字符串。 如果 iterable 中存在任何非字符串值包括bytes
对象则会引发TypeError
。 调用该方法的字符串将作为元素之间的分隔。
‘:’.join(“2020 09 05 13 54”.split())
‘2020:09:05:13:54’
替换
replace
(old, new[, count])
返回字符串的副本,其中出现的所有子字符串 old 都将被替换为 new。 如果给出了可选参数 count,则只替换前 count 次出现。
>>> “”.join(“hello world,i’m lady killer”[::-1]).replace(‘dlrow’,‘world’)
“rellik ydal m’i,world olleh”
移除前导、末尾字符
strip
([chars])
返回原字符串的副本,移除其中的前导和末尾字符。 chars 参数为指定要移除字符的字符串。 如果省略或为 None
,则 chars 参数默认移除空格符。 实际上 chars 参数并非指定单个前缀或后缀;而是会移除参数值的所有组合。
" hello world ".strip()
‘hello world’
"12.45 ".strip()
‘12.45’
“2323345623323”.strip(‘32’)
‘456’
32可以组合成2、3、23、32等。 你可以理解为前后遍历含chars中任一字符便删除,无法删除时停止。
统计子串
count
(sub[, start[, end]])
返回子字符串 sub 在 [start, end] 范围内非重叠出现的次数,默认是整个字符串。 可选参数 start 与 end, 会被解读为切片表示法。
‘www.example.com’.count(‘com’)
1‘www.example.com’.count(‘w’,1,7)
2
寻找子串索引
find
(sub[, start[, end]])
返回子字符串 sub 在 s[start:end]
切片内被找到的最小索引。 可选参数 start 与 end 会被解读为切片表示法。 如果 sub 未被找到则返回 -1
。
‘www.example.com’.find(‘w’,1,7)
1
‘www.example.com’.find(‘w’,3,7)
-1
rfind方法,参数相同,返回找到的最大的索引
index与rindex在未找到时会引发ValueError,不建议使用。
转换大小写
转为小写
lower
()
返回原字符串的副本,其所有区分大小写的字符均转换为小写。
‘WWW.example.com’.lower()
‘www.example.com’
转为大写
upper
()
返回原字符串的副本,其中所有区分大小写的字符均转换为大写。 请注意如果 s
包含不区分大小写的字符或者如果结果字符的 Unicode 类别不是 “Lu” (Letter, uppercase) 而是 “Lt” (Letter, titlecase) 则 s.upper().isupper()
有可能为 False
。
>>> ‘www.example.com’.upper()
‘WWW.EXAMPLE.COM’
判断字符串类型
全是字母
isalpha
()
如果字符串中的所有字符都是字母,并且至少有一个字符,返回 True
,否则返回 False
。字母字符是指那些在 Unicode 字符数据库中定义为 “Letter” 的字符,即那些具有 “Lm”、“Lt”、“Lu”、“Ll” 或 “Lo” 之一的通用类别属性的字符。 注意,这与 Unicode 标准中定义的"字母"属性不同。
‘www.example.com’.isalpha()
False
‘wwwexamplecom’.isalpha()
True
全是数字
isdecimal
()
如果字符串中的所有字符都是十进制字符且该字符串至少有一个字符,则返回 True
, 否则返回 False
。十进制字符指那些可以用来组成10进制数字的字符,例如 U+0660 ,即阿拉伯字母数字0 。 严格地讲,十进制字符是 Unicode 通用类别 “Nd” 中的一个字符。
‘1’.isdecimal()
True‘IV’.isdecimal()
False‘六六六’.isdecimal()
False
isdigit
()
如果字符串中的所有字符都是数字,并且至少有一个字符,返回 True
,否则返回 False
。 数字包括十进制字符和需要特殊处理的数字,如兼容性上标数字。这包括了不能用来组成十进制数的数字,如 Kharosthi 数。 严格地讲,数字是指属性值为 Numeric_Type=Digit 或 Numeric_Type=Decimal 的字符。
‘IV’.isdigit()
False
‘六六六’.isdigit()
False
isnumeric
()
如果字符串中至少有一个字符且所有字符均为数值字符则返回 True
,否则返回 False
。 数值字符包括数字字符,以及所有在 Unicode 中设置了数值特性属性的字符,例如 U+2155, VULGAR FRACTION ONE FIFTH。 正式的定义为:数值字符就是具有特征属性值 Numeric_Type=Digit, Numeric_Type=Decimal 或 Numeric_Type=Numeric 的字符。
‘IV’.isnumeric()
False‘六六六’.isnumeric()
True
大小写
isupper
()
如果字符串中至少有一个区分大小写的字符 4 且此类字符均为大写则返回 True
,否则返回 False
。
islower
()
如果字符串中至少有一个区分大小写的字符 4 且此类字符均为小写则返回 True
,否则返回 False
。
对齐
居中
center
(width[, fillchar])
返回长度为 width 的字符串,原字符串在其正中。 使用指定的 fillchar 填充两边的空位(默认使用 ASCII 空格符)。 如果 width 小于等于 len(s)
则返回原字符串的副本。
左对齐
ljust
(width[, fillchar])¶
返回长度为 width 的字符串,原字符串在其中靠左对齐。 使用指定的 fillchar 填充空位 (默认使用 ASCII 空格符)。 如果 width 小于等于 len(s)
则返回原字符串的副本。
右对齐
rjust
(width[, fillchar])
返回长度为 width 的字符串,原字符串在其中靠右对齐。 使用指定的 fillchar 填充空位 (默认使用 ASCII 空格符)。 如果 width 小于等于 len(s)
则返回原字符串的副本。
zfill
(width)
返回原字符串的副本,在左边填充 ASCII '0'
数码使其长度变为 width。 正负值前缀 ('+'
/'-'
) 的处理方式是在正负符号 之后 填充而非在之前。 如果 width 小于等于 len(s)
则返回原字符串的副本。
格式化
format
(*args, **kwargs)
执行字符串格式化操作。 调用此方法的字符串可以包含字符串字面值或者以花括号 {}
括起来的替换域。 每个替换域可以包含一个位置参数的数字索引,或者一个关键字参数的名称。 返回的字符串副本中每个替换域都会被替换为对应参数的字符串值。
其他
方法太多,上面列举了经常用的,其余的请查看官方文档。
相关内置函数
字符串长度
不像c++ string,没有length()方法,但可以使用len函数返回长度。
len
(s)
返回对象的长度(元素个数)。
len(‘hello world’)
11
字符的Unicode码
chr
(i)
返回 Unicode 码位为整数 i 的字符的字符串格式。
ord
(c)
对表示单个 Unicode 字符的字符串,返回代表它 Unicode 码点的整数。
chr(97)
‘a’
ord(‘a’)
97
其他类型转为字符串
class str
(object=b’', encoding=‘utf-8’, errors=‘strict’)
返回一个str版本的对象
num = 65
s = str(num)
type(s)
<class ‘str’>
常用函数
常在oj中使用的函数
获得所有非空子串
列表表达式+切片
def get_substring(a_str):
n = len(a_str)
return [a_str[i:j + 1] for i in range(n) for j in range(i, n)]
获得所有非空子序列
二进制+位运算
def get_subsequence(a_str):
n = len(a_str)
sub_sequence = []
for i in range(1, 1 << n):
substr = ""
for j in range(n):
if i >> j & 1 == 1:
substr += a_str[j]
sub_sequence.append(substr)
return sub_sequence
判断是不是非空字符串的非空子序列
双指针
def is_subsequence(a, b):
i, j, m, n = 0, 0, len(a), len(b)
while j < n and i < m:
if a[i] == b[j]:
i += 1
j += 1
else:
i += 1
return j == n
判断是否为回文字符串
双指针
def is_huiwen(a_str):
left, right = 0, len(a_str) - 1
while left < right:
if a_str[left] != a_str[right]:
return False
left += 1
right -= 1
return True
相关模块
- string — 常见的字符串操作
- re — 正则表达式操作
- difflib — 计算差异的辅助工具
- textwrap — 文本自动换行与填充
- unicodedata — Unicode 数据库
- stringprep — 因特网字符串预备
- readline — GNU readline 接口
- rlcompleter — GNU readline 的补全函数
模块过多,博主也没有学全,关于正则表达式及简单应用,可以看文章python-正则表达式及应用(b站弹幕屏蔽)")
如果你也是看准了Python,想自学Python,在这里为大家准备了丰厚的免费学习大礼包,带大家一起学习,给大家剖析Python兼职、就业行情前景的这些事儿。
一、Python所有方向的学习路线
Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
二、学习软件
工欲善其必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。
三、全套PDF电子书
书籍的好处就在于权威和体系健全,刚开始学习的时候你可以只看视频或者听某个人讲课,但等你学完之后,你觉得你掌握了,这时候建议还是得去看一下书籍,看权威技术书籍也是每个程序员必经之路。
四、入门学习视频
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。
四、实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
五、面试资料
我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
成为一个Python程序员专家或许需要花费数年时间,但是打下坚实的基础只要几周就可以,如果你按照我提供的学习路线以及资料有意识地去实践,你就有很大可能成功!
最后祝你好运!!!