Python的一些内建函数2

本文详细介绍了Python中字符串类型的内建方法及其用法,包括字符串格式化、搜索、替换等常见操作,并附带解释了Unicode的基本概念。
1.字符串类型内建方法 
方法                   描述 
string.capitalize()   把字符串的第一个字符大写 
string.center(width)   返回一个原字符串居中,并使用空格填充至长度 width 的新字符串 
string.count(str, beg=0, 
end=len(string))  返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数 
string.decode(encoding='UTF-8', 
errors='strict')   以 encoding 指定的编码格式解码 string,如果出错默认报一个 ValueError 的 异 常 , 除 非 errors 指 定 的 是 'ignore' 或 者'replace' 
string.encode(encoding='UTF-8', 

errors='strict')   以 encoding 指定的编码格式编码 string,如果出错默认报一个ValueError 的异常,除非 errors 指定的是'ignore'或者'replace' 

string.endswith(obj, beg=0, 

end=len(string)) 检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False. 
string.expandtabs(tabsize=8)把字符串 string 中的 tab 符号转为空格,默认的空 格数 tabsize 是 8. 
string.find(str, beg=0, 
end=len(string))    检测 str 是否包含在 string 中,如果 beg 和 end 指定范围,则检查是否包含在指定范围内,如果是返回开始的索引值,否则返回-1 
string.index(str, beg=0, 
end=len(string))     跟find()方法一样,只不过如果str不在 string中会报一个异常. 
string.isalnum()  R 如果 string 至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False 
string.isalpha()  如果 string 至少有一个字符并且所有字符都是字母则返回 True,否则返回 False 
string.isdecimal()  如果 string 只包含十进制数字则返回 True 否则返回 False. 
string.isdigit()  如果 string 只包含数字则返回 True 否则返回 False. 
string.islower()  如果 string 中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False
string.isnumeric()  如果 string 中只包含数字字符,则返回 True,否则返回 False 
string.isspace()  如果 string 中只包含空格,则返回 True,否则返回 False. 
string.istitle()  如果 string 是标题化的(见 title())则返回 True,否则返回 False 
string.isupper()  如果 string 中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False 
string.join(seq)   Merges (concatenates)以 string 作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串 
string.ljust(width) 返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串 
string.lower() 转换 string 中所有大写字符为小写.    
string.lstrip() 截掉 string 左边的空格 
string.partition(str) 有点像 find()和 split()的结合体,从 str 出现的第一个位置起,把 字 符 串 string 分 成 一 个 3 元 素 的 元 组(string_pre_str,str,string_post_str),如果string 中不包含str 则 string_pre_str == string. 
string.replace(str1, str2,  
num=string.count(str1)) 把 string 中的 str1 替换成 str2,如果 num 指定,则替换不超过 num 次. 
string.rfind(str, beg=0,end=len(string) )类似于 find()函数,不过是从右边开始查找. 
string.rindex( str, beg=0,end=len(string))   类似于 index(),不过是从右边开始. 
string.rjust(width) 返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串  
string.rpartition(str)   类似于 partition()函数,不过是从右边开始查找. 
string.rstrip() 删除 string 字符串末尾的空格. 
string.split(str="", num=string.count(str)) 以 str 为分隔符切片 string,如果 num有指定值,则仅分隔 num 个子字符串 
string.splitlines(num=string.count('\n'))按照行分隔,返回一个包含各行作为元素的列表,如果 num 指定则仅切片 num 个行. 
string.startswith(obj, beg=0,end=len(string))检查字符串是否是以 obj 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查. 
string.strip([obj])   在 string 上执行 lstrip()和 rstrip() 
string.swapcase()  翻转 string 中的大小写 
string.title()  返回"标题化"的 string,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle()) 
string.translate(str, del="") 根据 str 给出的表(包含 256 个字符)转换 string 的字符,要过滤掉的字符放到 del 参数中 
string.upper() 转换 string 中的小写字母为大写 

string.zfill(width)   返回长度为 width 的字符串,原字符串 string 右对齐,前面填充0

2.Unicode 术语 
名词       意思 
ASCII     美国标准信息交换码 
BMP         基本多文种平面(第零平面) 
BOM         字节顺序标记(标识字节顺序的字符) 
CJK/CJKV     中文-日文-韩文(和越南语)的缩写 
Code point 类似于 ASCII 值,代表 Unicode 字符的值,范围在 range(1114112)或者说 0x000000 到 0x10FFFF. 
Octet     八位二进制数的位组 
UCS         通用字符集 
UCS2       UCS 的双字节编码方式(见 UTF-16) 
UCS4        UCS 的四字节编码方式. 
UTF         Unicode 或者 UCS 的转换格式. 
UTF-8   八位 UTF 转换格式(无符号字节序列, 长度为一到四个字节)

UTF-16   16 位 UTF 转换格式(无符号字节序列,通常是 16 位长[两个字节],见 UCS2) 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值