10.20集合与字符串

10.20集合与字符串

集合相关知识

集合是容器型数据类型,将{}作为容器的标志:{元素1, 元素2, 元素3,…}

可变的;无序的

元素 - 必须是不可变类型的数据; 唯一的(自带去重功能)

空集合表达为:s1 = set()

集合无序

print({1, 2, 3} == {3, 2, 1}) ,结果一样,输出True

集合的元素是不可变的数据且列表不可以作为集合的元素,元素是唯一的,集合自带去重的功能

s1 = {10, 20, 30, 10, 10}
print(s1) 输出{10, 20, 30}

合元素的增删改查

查 (只有遍历)

形式为:
for 元素 in 集合:
循环体

集合.add(元素) - 将指定元素添加到集合中

集合.update(序列) - 将序列中的元素全部添加到集合中

集合.remove(元素) - 删除指定元素;元素不存报错

集合.discard(元素) - 删除指定元素;元素不存在不报错(不会发生事情)

数学集合运算符

Python中的集合支持数学集合运算:交集(&)、并集(|)、差集(-)、对称差集(^)、子集(>=、<=)、真子集(>、<)

交集

获取两个集合的公共部分

集合1 & 集合2

s1 = {1, 2, 3, 4, 5, 6, 7}
s2 = {5, 6, 7, 8, 9}
print(s1 & s2)      # {5, 6, 7}

并集

合1 | 集合2 - 将两个集合合并成一个集合

print(s1 | s2)      # {1, 2, 3, 4, 5, 6, 7, 8, 9}

差集

集合1 - 集合2 - 去掉集合1中被包含在集合2的部分剩下的部分

print(s1 - s2)      # {1, 2, 3, 4}
print(s2 - s1)      # {8, 9}

对称差集

集合1 ^ 集合2 - 合并两个集合去掉公共部分

print(s1 ^ s2)      # {1, 2, 3, 4, 8, 9}

子集与真子集

{1, 2, 3} 子集:{}、{1}、{2}、{3}、{1, 2}, {2, 3}、{1, 3}、{1, 2, 3}
{1, 2, 3} 真子集:{}、{1}、{2}、{3}、{1, 2}, {2, 3}、{1, 3}

集合1 > 集合2 - 判断集合2是否是集合1的真子集
集合1 < 集合2 - 判断集合1是否是集合2的真子集s
集合1 >= 集合2 - 判断集合2是否是集合1的子集
集合1 <= 集合2 - 判断集合1是否是集合2的子集

字符串与字符

字符串

字符串是容器型数据类型,将’’、""、""""""、’’’’’'作为容器标志,里面的每一个符号就是它的元素。

它是不可变的;有序的

元素(字符) - 就是引号中的每个符号,这里的符号分为两种:普通字符和转义字符

“”"开头和’’'开头的字符串,可以直接在字符串内部通过回车直接换行,'开头和"开头的字符串换行必须使用转义字符\n

字符

字符就是字符串中的元素(引号中每个独立的符号)

普通字符 - 符号在字符串中表示符号本身

转义字符 - 在特定符号前加\用来表示特殊功能或者特殊意义的符号

\n - 换行
\t - 水平制表符(tab键)
’ - 一个普通的单引号
" - 一个普通的双引号
\ - 一个普通的反斜杠

str1 = '\tabc\n123'                     #	abc
print(str1)                             #123

str1 = 'it\'s me!'        #it's me!
print(str1)

str1 = "it's me!"         #it's me!
print(str1)
 
str1 = "i say:\"good good study, day day up!\""          
print(str1)    #i say:"good good study, day day up!"

str1 = 'i say:"good good study, day day up!"'
print(str1)    #i say:"good good study, day day up!"

str1 = 'C:\\test\\name\pop.txt'
print(str1)   #C:\test\name\pop.txt

str1 = 'abc\\n123'
print(str1)    #abc\n123

字符编码

编码字符

转义字符中的一种

\u4位的16进制数 - 表示的是16进制数作为编码值对应的字符
16进制数(每一位上的数是09或者a/Af/F): af、9f4、23ac78

str1 = 'abc\u5fa5123\u789a'
print(str1) #abc徥123碚

字符编码

计算机存储数据的时候只具备存储数字的能力;计算机要存储文字符号(字符)的时候,其实存的时候这个符号对应的编码值

每个符号都对应一个固定的数字,当计算机要存储这个符号的时候就存这个符号对应的数字。(每个符号对应的数字就是这个符号的编码值)

字符编码表

它存储了每个符号对应的编码值

ASCII码表: 总共有128个字符
数字字符在大写字母的前面,大写字母在小写字母前面,大写字母和小写字母之间有间隙

Unicode编码表(Python使用的)
包含了世界上所有国家所有的民族的所有语言的符号。
Unicode中包含了ASCII码表
中文编码范围: 4e00 ~ 9fa5

chr(编码值) - 获取编码值对应的字符

result = chr(97)
print(result)       # 'a'

result = chr(36)
print(result)       # '$'

python中16进制数的表示方式: 0x后面跟十六进制数

result = chr(0x4e00)
print(result)       # '一'

result = chr(0x6fab)
print(result)       # 澫

print(0x9fa5 - 0x4e00)      # 20901

ord(字符) - 获取字符对应的编码值

print(ord('a')) #20313
print(ord('余'), ord('婷'))#23159

编码字符: \u4位的16进制编码值

str1 = '一\u4e00\u0061'
print(str1)#一一a

字符串相关操作

字符串获取元素和列表获取元素的语法一样

str1 = 'you see see, one day day!'
print(str1[0], str1[-1])   # 'y'  '!'

一个转义字符的长度是1 ,一个进制数也算长度1

+、*

print('abc' + '123')     # 'abc123'
print('abc' + ' ' + '123')    # 'abc 123'
print('abc' * 3)        # 'abcabcabc'

比较运算

比较第一对不相等的字符的编码值的大小

判断字符的性质:
是否是数字字符:‘0’ <= x <= ‘9’
是否是大写字母:‘A’ <= x <= ‘Z’
是否是小写字母:‘a’ <= x <= ‘z’
是否是字母:‘A’ <= x <= ‘Z’ or ‘a’ <= x <= ‘z’
是否是中文:’\u4e00’ <= x <= ‘\u9fa5’

相关练习

统计字符串中数字字符的个数

str1 = '手机号-2=skMs--90设计费64、、、0'
count = 0
for x in str1:
    if '0' <= x <= '9':
        count +=1
print(count)

in和not in

字符串1 in 字符串2 - 判断字符串2中是否存在字符串1(字符串2中是否包含字符串1)

print(10 in [10, 20, 30, 40])   # True
print([10, 20] in [10, 20, 30, 40])   # False
print([10, 20] in [[10, 20], 30, 40])       # True

print('a' in 'abcd')    # True
print('ab' in 'abcd')   # True
print('ac' in 'abcd')   # False

相关函数

len (字符串)

str(数据) - 将数据转换成字符串(a.任何类型的数据都可以转换成字符串 b.转换的时候是直接在数据的打印值外面加引号)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值