1、集合的定义
- python内置的一种数据结构,可变数据结构
- 集合是无序的数据类型,添加顺序和在集合中存储的顺序是不一定相同的(这一点和字典一样)
- 集合是没有value的字典
2、集合的创建
(1).集合里面的元素是不可重复的(因为相对于字典中的key值)
第一种创建方式:
#定义集合
s = {1,2,3,1,4,3,5}
print(s)
#type:数据类型 (set表示集合)
print(type(s))
运行结果:自动将重复的数据省去
(2)第二种创建方式:set()
s1 = set(range(10))
print(s1,type(s1))
运行结果:
(3)定义空集合:如果直接用{}
去定义,会定义成字典类型,所以不能直接空花括号。
s3 = {}
print(type(s3))
运行结果:
利用set创建:
s3 = set()
print(type(s3))
运行结果:
3、集合的操作
(1)去重
#定义列表
li = [1,2,3,1,2,3]
print(li)
#先强制转换为集合类型,再强制转换为列表类型;
#目的在于:去掉重复元素
print(list(set(li)))
集合只支持成员操作符和for循环遍历,与列表、元组相比,不具备切片、索引、重复、连接的特性。因为它和字典一样是无序结构,因此不具备索引,便不具备切片,而且不能重复,所以不能*3,连接操作。
(1).成员操作符
s = {1,2,3}
print(1 in s)
print(5 in s)
运行结果:
(2).for循环遍历(迭代)
s = {1,2,3}
for i in s:
print(i,end='|')
运行结果:
4、集合的增删改查
(1)add增加一个元素
s = {6,7,8,9}
#add:增加一个元素
s.add(1)
print(s)
运行结果:
(2)update增加多个元素
###我们发现update函数里面可以添加元组、列表、集合的数据类型
a = {'name','ghjcika','hoo','gh'}
a.update([1,34,'gsf'])
a.update({'fcs','fcsvac','fews'})
a.update(('vvsdz','vsd'))
print(a)
运行结果:
(3) pop删除任意一个元素
s = {6,7,8,9}
print(s)
s.pop()
print(s)
运行结果:
(4) remove删除指定元素,若指定元素不存在,抛出keyerror
a = {'name','ghjcika','hoo','gh'}
print(type(a))
a.remove('name')
print(a)
a.remove('fs')
运行结果:
- discard() :删除指定元素,若指定元素不存在,不抛出异常
a = {'name','ghjcika','hoo','gh'}
print(type(a))
a.discard('name')
print(a)
a.discard('fs')
print(a)
运行结果:
(5)clear:清空集合
a = {'name','ghjcika','hoo','gh'}
a.clear()
print(a)
运行结果:
5、集合之间的关系及数学操作
(1)判断两个集合是否相等,因为集合是无序的
s1 = {1,2,3,4}
s2 = {4,3,2,1}
print(s1 == s2)
运行结果:
(2)一个集合是否是一个集合的子集:.issubset()
s1 = {1,2,3,4}
s2 = {4,3,2,1,78,45}
print(s1.issubset(s2))
运行结果:
(3)一个集合是另一个集合的超集:issuperset()
(4)两个集合是否没有交集?:isdisjoint()
s1 = {1,2,3,4}
s2 = {4,3,2,1,78,45}
print(s1.isdisjoint(s2))
运行结果:
(6)求并集的两种方式:union()、|
s1 = {1,2,3}
s2 = {2,3,4}
print('并集:',s1.union(s2)) ##第一种
print('并集:',s1|s2) ##第二种
运行结果:
(7)求交集的两种方法:interse()、&
s1 = {1,2,3,4}
s2 = {4,3,2,1,78,45}
print(s1.intersection(s2))
print(s1 & s2)
运行结果:
(7)求差集的两种方法:.difference()、-
s1 = {1,2,3,4,67,45,90}
s2 = {4,3,2,1,78,45}
print(s1.difference(s2)) # s1-(s1&s2)
print(s1 - s2)
print(s2.difference(s1)) # s2-(s1&s2)
print(s2-s1)
运行结果:
(8)求对等差集的两种方式 (并集-交集)
s1 = {1,2,3}
s2 = {2,3,4}
print('对等差分:',s2.symmetric_difference(s1))
print('对等差分:',s1^s2)
运行结果:
6、集合生成式
a = {i for i in range(6)}
print(a)
b = {i*i for i in range(10)}
print(b)
运行结果:
综合练习:
需求:
明明想在学校中请一些同学一起做一项问卷调查,为了实验的客观性
他先用计算机生成了N个1~1000之间的随机整数(N<=1000),N是用户输入的,对于
其中重复的数字,只保留一个,把其余相同的数字去掉,不同的数对应
着不同的学生的学号,然后再把这些
数从小到大排序,按照排好的顺序去找同学做调查,请你协助明明完成
“去重”与排序工作
代码:
import random
s = set([])
for i in range(int(input('N: '))):
s.add(random.randint(1,1000))
print(s)
print(sorted(s))