DW-Python-Task05：字典、集合和序列

最新推荐文章于 2025-05-20 18:28:23 发布

叶xinwu

最新推荐文章于 2025-05-20 18:28:23 发布

阅读量329

点赞数

分类专栏： DW-Python 文章标签： python

本文链接：https://blog.youkuaiyun.com/ycs1010647987/article/details/107692112

版权

DW-Python 专栏收录该内容

9 篇文章

订阅专栏

本文深入探讨Python中字典和集合的特性、创建方法、常用操作及应用场景，包括字典的键值对管理、集合的数学运算，以及两者在数据处理中的优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

字典

1. 字典的特点

1.1 key数据类型只能为不可变类型

序列是以连续的整数为索引，与此不同的是，字典以"关键字"为索引，关键字可以是任意不可变类型 （包括字符串，数值，元组），通常用字符串或数值。
字典是 Python 唯一的一个映射类型，字符串、元组、列表属于序列类型。
那么如何快速判断一个数据类型 X 是不是可变类型的呢？（用于判断是否能作为字典的key）两种方法：

麻烦方法：用 id(X) 函数，对 X 进行某种操作，比较操作前后的 id，如果不一样，则 X 不可变，如果一样，则 X 可变。
便捷方法：用 hash(X)，只要不报错（错误类型为：TypeError），证明 X 可被哈希，即不可变，反过来不可被哈希，即可变。

1.2 dict 查找和插入的速度极快，不会随着 key 的增加而增加，但是需要占用大量的内存。

2. 创建字典

2.1 `{}`

dic1 = {1: 'one', 2: 'two', 3: 'three'}
dic = {(1, 2, 3): "Tom", "Age": 12, 3: [3, 5, 7]}

注意key的类型只能为数值、元组和字符串

2.2 `dict()`（以下这些创建方式都是只能用`dict()`而不能用`{}`的）

2.2.1 `dict(mapping)`

new dictionary initialized from a mapping object’s (key, value) pairs
注意，只能传入一个参数，形式如下：

dic = dict([[1,'one'],[2,'two']])
dic = dict([(1,'one'),(2,'two')])
dic = dict(((1,'one'),(2,'two')))
dic = dict(([1,'one'],[2,'two']))
dic = dict({(1,'one'),(2,'two')})

dic = dict(({'one',1},{2,'two'}))
'''
最后这个方法虽然不会报错，但是因为集合是没有顺序的，所以传入之后并不能保证集合前面的元素为key，后面的元素为value
'''

2.2.2 `dict(**kwargs)`

new dictionary initialized with the name=value pairs in the keyword argument list. For example: dict(one=1, two=2)
与2.2.1不同在于可以传入多个参数
这种情况下，键只能为字符串类型，并且创建的时候字符串不能加引号，加上就会直接报语法错误。

dic = dict(name='Tom', age=10)
print(dic)  # {'name': 'Tom', 'age': 10}

这时候等号左边的字符串（也就是key）虽然不加引号，但是会被当作一个字符串，就算前面有以这个字符串命名的变量，也不会取以其命名的字符串，eg:

name = 'dcu'
dic = dict(name='Tom', a=10)
print(dic)  # {'name': 'Tom', 'age': 10}

2.3 `dict.fromkeys(seq[, value])`

用于创建一个新字典，以序列 seq 中元素做字典的键，value 为字典所有键对应的初始值。（也就是如果value位置传入一个元组或者数组，它是不会被拆开的）
eg:

seq = ('name', 'age', 'sex')
dic1 = dict.fromkeys(seq)
print(dic1)
#{'name': None, 'age': None, 'sex': None}

dic2 = dict.fromkeys(seq, 10)
print(dic2)
#{'name': 10, 'age': 10, 'sex': 10}

dic3 = dict.fromkeys(seq, ('小马', '8', '男'))
print(dic3)
#{'name': ('小马', '8', '男'), 'age': ('小马', '8', '男'), 'sex': ('小马', '8', '男')}

3. 往字典中添加元素

直接用dic['new_key'] = 'new_value'

4. 字典的内置方法

4.1 根据字典返回可迭代对象的三大方法

dict.keys() dict.values() dict.items()
dict.keys()和dict.values()以列表返回可遍历的数组
dict.items()以列表返回可遍历的 (键, 值) 元组数组。
三个方法返回的列表都可以用list() set() tuple()转化成相应的容器类型

dic = {'Name': 'lsgogroup', 'Age': 7}
print(dic.keys())  # dict_keys(['Name', 'Age'])

dic = {'Sex': 'female', 'Age': 7, 'Name': 'Zara'}
print(dic.values())
# dict_values(['female', 7, 'Zara'])

dic = {'Name': 'Lsgogroup', 'Age': 7}
print(dic.items())
# dict_items([('Name', 'Lsgogroup'), ('Age', 7)])

4.2 其他方法

dict.get(key, default=None) 返回指定键的值，如果值不在字典中返回默认值。

dic = {'Name': 'Lsgogroup', 'Age': 27}
print("Age 值为 : %s" % dic.get('Age'))  # Age 值为 : 27
print("Sex 值为 : %s" % dic.get('Sex', "NA"))  # Sex 值为 : NA

dict.setdefault(key, default=None)和get()方法类似, 如果键不存在于字典中，将会添加键并将值设为默认值，与get()不同在于可以同时完成写入。

dic = {'Name': 'Lsgogroup', 'Age': 7}
print("Age 键的值为 : %s" % dic.setdefault('Age', None))  # Age 键的值为 : 7
print("Sex 键的值为 : %s" % dic.setdefault('Sex', None))  # Sex 键的值为 : None
print(dic)  
# {'Age': 7, 'Name': 'Lsgogroup', 'Sex': None}

key in dict in 操作符用于判断键（注意不是判断值）是否存在于字典中，如果键在字典 dict 里返回true，否则返回false。而not in操作符刚好相反，如果键在字典 dict 里返回false，否则返回true。
dict.pop(key[,default])删除字典给定键key所对应的键值对，返回值为被删除的值。key 值必须给出。若key不存在，则返回 default 值。
del dict[key] 删除字典给定键 key 所对应的键值对。

dic1 = {1: "a", 2: [1, 2]}
print(dic1.pop(1), dic1)  # a {2: [1, 2]}

# 设置默认值，必须添加，否则报错
print(dic1.pop(3, "nokey"), dic1)  # nokey {2: [1, 2]}

del dic1[2]
print(dic1)  # {}

dict.popitem()随机返回并删除字典中的一对键和值，如果字典已经为空，却调用了此方法，就报出KeyError异常。
eg:

dic1 = {1: "a", 2: [1, 2]}
print(dic1.popitem())  # (1, 'a')
print(dic1)  # {2: [1, 2]}

dict.clear()用于删除字典内所有元素。
dict.copy()返回一个字典的浅复制。
直接赋值和 copy 的区别（认真理解）:

dic1 = {'user': 'lsgogroup', 'num': [1, 2, 3]}

# 引用对象
dic2 = dic1  
# 浅拷贝父对象（一级目录），子对象（二级目录）不拷贝，还是引用
dic3 = dic1.copy()  

print(id(dic1))  # 148635574728
print(id(dic2))  # 148635574728
print(id(dic3))  # 148635574344
#直接赋值地址相同，浅拷贝地址不同，相当于复制了值

# 修改 data 数据
dic1['user'] = 'root'
dic1['num'].remove(1)

# 输出结果
print(dic1)  # {'user': 'root', 'num': [2, 3]}
print(dic2)  # {'user': 'root', 'num': [2, 3]}
print(dic3)  # {'user': 'lsgogroup', 'num': [2, 3]}

原理：
浅拷贝相当于把字典中的键值对赋值给新的字典，而字典中的列表、元组等对应的是地址，所以是对地址进行的拷贝，因此对原字典中的列表进行修改的时候是在原来列表的地址上进行修改，那么浅拷贝的列表自然也会被修改。
直接赋值的时候，共用一个地址。

dict.update(dict2)把字典参数dict2的 key:value对更新到字典dict里。
如果dict和dict2里面有相同的key，则用dict2的key覆盖掉dict的key，其实这个方法相当于批量赋值。
eg:

dic = {'Name': 'Lsgogroup', 'Age': 7}
dic2 = {'Sex': 'female', 'Age': 8}
dic.update(dic2)
print(dic)  
# {'Sex': 'female', 'Age': 8, 'Name': 'Lsgogroup'}

5. 习题

1、字典基本操作

字典内容如下:

dic = {
    'python': 95,
    'java': 99,
    'c': 100
    }

用程序解答下面的题目

字典的长度是多少
请修改’java’ 这个key对应的value值为98
删除 c 这个key
增加一个key-value对，key值为 php, value是90
获取所有的key值，存储在列表里
获取所有的value值，存储在列表里
判断 javascript 是否在字典中
获得字典里所有value 的和
获取字典里最大的value
获取字典里最小的value
字典 dic1 = {‘php’: 97}，将dic1的数据更新到dic中

解：

len(dic)
dic['java'] = 98
del dic['c']
dic['php'] = 90
lst = list(dic.keys())
lst1 = list(dic.values())
'javascript' in dic
sum(dic.values())
max(dic.values())
min(dic.values())
dic.update(dic1)

2、字典中的value

有一个字典，保存的是学生各个编程语言的成绩，内容如下

data = {
        'python': {'上学期': '90', '下学期': '95'},
        'c++': ['95', '96', '97'],
        'java': [{'月考':'90', '期中考试': '94', '期末考试': '98'}]
        }

各门课程的考试成绩存储方式并不相同，有的用字典，有的用列表，但是分数都是字符串类型，请实现函数transfer_score(score_dict)，将分数修改成int类型

def transfer_score(data):
    # your code here

集合

1. 集合的创建

python 中set与dict类似，也是一组key的集合，但不存储value。由于key不能重复，所以，在set中，没有重复的key。

注意，key为不可变类型，即可哈希的值。
在创建空集合的时候只能使用s = set()，因为s = {}创建的是空字典。
如果向 set()中传入字典，返回一个由key组成的集合：

st = set({1:1,2:4})
st
# {1,2}

2. 集合的函数和方法（不包括数学意义上的集合操作）

len()
set.add(elmnt)用于给集合添加元素，如果添加的元素在集合中已存在，则不执行任何操作。
不会把传进去的元素拆开

fruits = {"apple", "banana", "cherry"}
fruits.add(("orange",'sb'))
print(fruits)  
# {'apple', 'cherry', 'banana', ('orange', 'sb')}

set.update(set)用于修改当前集合，可以添加新的元素或集合到当前集合中，如果添加的元素在集合中已存在，则该元素只会出现一次，重复的会忽略。
和add()不同之处在于会把传入的元素拆开
set.remove(item) 用于移除集合中的指定元素。如果元素不存在，则会发生错误。
set.discard(value) 用于移除指定的集合元素。remove() 方法在移除一个不存在的元素时会发生错误，而 discard() 方法不会。
set.pop()用于随机移除一个元素，并且返回被移除的元素。

3. 集合的数学意义上的集合操作

3.1 交

3.1.1 求交

set.intersection(set1, set2 ...) 返回两个集合的交集。
set1 & set2 返回两个集合的交集。
set.intersection_update(set1, set2 ...) 交集，在原始的集合（也就是这里的set）上移除不重叠的元素。

3.1.2 判断是否相交

set.isdisjoint(set)用于判断两个集合是不是不相交，如果是返回 True，否则返回 False。

3.2 并

set.union(set1, set2...) 返回两个集合的并集。
set1 | set2 返回两个集合的并集。

3.3 差

set.difference(set) 返回集合的差集。
set1 - set2 返回集合的差集。
set.difference_update(set) 集合的差集，直接在原来的集合中移除元素，没有返回值。
a-b就是从a中减去a与b重复的元素

a = set('abracadabra')
b = set('alacazam')
print(a)  # {'r', 'a', 'c', 'b', 'd'}
print(b)  # {'c', 'a', 'l', 'm', 'z'}

c = a.difference(b)
print(c)  # {'b', 'd', 'r'}
print(a - b)  # {'d', 'b', 'r'}

3.4 异或（就是交集的补）

set.symmetric_difference(set)返回集合的异或。
set1 ^ set2 返回集合的异或。
set.symmetric_difference_update(set)移除当前集合中在另外一个指定集合相同的元素，并将另外一个指定集合中不同的元素插入到当前集合中。

a = set('abracadabra')
b = set('alacazam')
print(a)  # {'r', 'a', 'c', 'b', 'd'}
print(b)  # {'c', 'a', 'l', 'm', 'z'}

c = a.symmetric_difference(b)
print(c)  # {'m', 'r', 'l', 'b', 'z', 'd'}
print(a ^ b)  # {'m', 'r', 'l', 'b', 'z', 'd'}

3.5 子集和超集

set.issubset(set)判断集合是不是被其他集合包含，如果是则返回 True，否则返回 False。
set1 <= set2 判断集合是不是被其他集合包含，如果是则返回 True，否则返回 False。
set.issuperset(set)用于判断集合是不是包含其他集合，如果是则返回 True，否则返回 False。
set1 >= set2 判断集合是不是包含其他集合，如果是则返回 True，否则返回 False。

4. 不可变集合

Python 提供了不能改变元素的集合的实现版本，即不能增加或删除元素，类型名叫frozenset。需要注意的是frozenset仍然可以进行集合操作，只是不能用带有update的方法。

frozenset([iterable]) 返回一个冻结的集合，冻结后集合不能再添加或删除任何元素。

5. 习题

怎么表示只包含⼀个数字1的元组。

{1}
创建一个空集合，增加 {‘x’,‘y’,‘z’} 三个元素。

empty_tuple = set()
empty_tuple.update('xyz')

列表[‘A’, ‘B’, ‘A’, ‘B’]去重。
*

list(set(['A','B','A','B']))

求两个集合{6, 7, 8}，{7, 8, 9}中不重复的元素（差集指的是两个集合交集外的部分）。
*

{6,7,8} ^ {7,8,9}

求{‘A’, ‘B’, ‘C’}中元素在 {‘B’, ‘C’, ‘D’}中出现的次数。
*

len({'A','B','C'} & {'B','C','D'})

序列

核心概念：序列都是可迭代的（iterable），可迭代对象不一定是序列（set,dict）

1. 针对序列的内置函数

可用于可迭代对象的函数都可以用于序列（包括list() tuple() len() max() min()等）

str(obj) 把obj对象转换为字符串

a = 123
a = str(a)
print(a)  # 123

str([1,2,3])
# '[1, 2, 3]'

sum(iterable[, start=0])返回序列iterable与可选参数start的总和。（不懂这个参数为什么要叫start?明明是个没啥用的鸡肋）

print(sum([1, 3, 5, 7, 9]))  # 25
print(sum([1, 3, 5, 7, 9], 10))  # 35

sorted(iterable, key=None, reverse=False) 对所有可迭代的对象进行排序操作。
iterable – 可迭代对象。
key – 主要是用来进行比较的元素，只有一个参数，具体的函数的参数就是取自于可迭代对象中，指定可迭代对象中的一个元素来进行排序，一般传入一个函数。
reverse– 排序规则，reverse = True 降序， reverse = False 升序（默认）。
返回重新排序的列表。

x = [-8, 99, 3, 7, 83]
print(sorted(x))  # [-8, 3, 7, 83, 99]
print(sorted(x, reverse=True))  # [99, 83, 7, 3, -8]

t = ({"age": 20, "name": "a"}, {"age": 25, "name": "b"}, {"age": 10, "name": "c"})
x = sorted(t, key=lambda a: a["age"])
print(x)
# [{'age': 10, 'name': 'c'}, {'age': 20, 'name': 'a'}, {'age': 25, 'name': 'b'}]

reversed(seq)函数返回一个反转的迭代器。
seq – 要转换的序列（注意是seq不是iterable，如集合就不行了），可以是 tuple, string, list 或 range。

s = 'lsgogroup'
x = reversed(s)
print(type(x))  # <class 'reversed'>
print(x)  # <reversed object at 0x000002507E8EC2C8>
print(list(x))
# ['p', 'u', 'o', 'r', 'g', 'o', 'g', 's', 'l']

enumerate(sequence, [start=0])
用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列，同时列出数据和数据下标（start为下标的起始值），一般用在 for 循环当中。

seasons = ['Spring', 'Summer', 'Fall', 'Winter']
a = list(enumerate(seasons))
print(a)  
# [(0, 'Spring'), (1, 'Summer'), (2, 'Fall'), (3, 'Winter')]

b = list(enumerate(seasons, 1))
print(b)  
# [(1, 'Spring'), (2, 'Summer'), (3, 'Fall'), (4, 'Winter')]

for i, element in a:
    print('{0},{1}'.format(i, element))

zip(iter1 [,iter2 [...]])
用于将可迭代的对象作为参数（可以多个，不限制为两个），将对象中对应的元素打包成一个个元组，然后返回由这些元组组成的对象，这样做的好处是节约了不少的内存。
我们可以使用 list()转换来输出列表。
如果各个迭代器的元素个数不一致，则返回列表长度与最短的对象相同，利用 *号操作符，可以将元组解压为列表（也就是将各个元组中对应位置的元素取出来组合成列表，列表的个数为所有元组中元素数量最少的元组的元素数量，见下面代码）。

a = [1, 2, 3]
b = [4, 5, 6]
c = [4, 5, 6, 7, 8]

zipped = zip(a, b)
print(zipped)  # <zip object at 0x000000C5D89EDD88>
print(list(zipped))  # [(1, 4), (2, 5), (3, 6)]
zipped = zip(a, c)
print(list(zipped))  # [(1, 4), (2, 5), (3, 6)]

a1, a2 = zip(*zip(a, b))
print(list(a1))  # [1, 2, 3]
print(list(a2))  # [4, 5, 6]

list(zip(*[(1,2,3),(4,5,6),(8,9)]))
# [(1, 4, 8), (2, 5, 9)]
# 元素最少的元组只有两个元素，所以都取前两个

2. 习题

怎么找出序列中的最⼤、⼩值？

max() min()
sort() 和 sorted() 区别
sort是list的方法，在list上直接操作，无返回值
sorted()是任何iterable的函数，有返回值，操作不是inplace的
怎么快速求 1 到 100 所有整数相加之和？
sum(range(1,101))
求列表 [2,3,4,5] 中每个元素的立方根。
循环直接算
将[‘x’,‘y’,‘z’] 和 [1,2,3] 转成 [(‘x’,1),(‘y’,2),(‘z’,3)] 的形式。
list(zip(['x','y','z'],[1,2,3]))