31、Python 字典与集合：全面解析与应用

backprop5master

于 2025-10-22 15:24:57 发布

阅读量14

点赞数

CC 4.0 BY-SA版权

分类专栏： Python入门指南文章标签： Python 字典集合

本文链接：https://blog.youkuaiyun.com/backprop5master/article/details/154380878

Python入门指南专栏收录该内容

44 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

Python 字典与集合：全面解析与应用

1. 字典基础

1.1 字典元素构成

字典中的元素由两部分组成，分别是键（Key）和值（Value）。键必须是不可变的，例如字符串、数字或元组；而值可以是任意数据类型。

1.2 示例分析

假设字典中有元素 'start' : 1472 ，那么 'start' 就是键， 1472 就是值。

1.3 字典操作示例

以下是一些常见的字典操作：

# 创建字典
employee = {}
# 添加键值对
employee['id'] = 54321
# 访问字典元素
stuff = {1 : 'aaa', 2 : 'bbb', 3 : 'ccc'}
print(stuff[3])  # 输出: ccc

1.4 检查键值对是否存在

可以使用 in 运算符来检查字典中是否存在某个键值对，示例如下：

if 'id' in employee:
    print('键 id 存在于字典中')

1.5 删除键值对

使用 del 语句可以删除字典中的指定键值对，例如：

inventory = {654: 'item'}
del inventory[654]

1.6 字典的长度

使用 len() 函数可以获取字典中键值对的数量，示例如下：

stuff = {1 : 'aaa', 2 : 'bbb', 3 : 'ccc'}
print(len(stuff))  # 输出: 3

1.7 遍历字典

可以使用 for 循环遍历字典的键，示例如下：

stuff = {1 : 'aaa', 2 : 'bbb', 3 : 'ccc'}
for k in stuff:
    print(k)

1.8 字典方法

方法	描述
`pop(key)`	删除指定键的键值对，并返回该键对应的值。如果键不存在，会引发 `KeyError` 异常。
`popitem()`	随机删除并返回一个键值对。
`items()`	返回一个包含字典所有键值对的视图对象。
`keys()`	返回一个包含字典所有键的视图对象。
`values()`	返回一个包含字典所有值的视图对象。

2. 集合基础

2.1 集合的特点

集合是一种存储唯一值的对象，类似于数学中的集合，具有以下特点：
- 集合中的元素是唯一的，不允许存储重复元素。
- 集合中的元素是无序的，没有特定的存储顺序。
- 集合中的元素可以是不同的数据类型。

2.2 创建集合

2.2.1 创建空集合

使用 set() 函数可以创建一个空集合，示例如下：

myset = set()

2.2.2 从可迭代对象创建集合

可以将列表、元组或字符串等可迭代对象作为参数传递给 set() 函数来创建集合，示例如下：

# 从列表创建集合
myset = set(['a', 'b', 'c'])
# 从字符串创建集合
myset = set('abc')

需要注意的是，如果传递的参数包含重复元素，集合中只会保留一个，示例如下：

myset = set('aaabc')  # 结果: {'a', 'b', 'c'}

如果要创建包含多个字符的字符串集合，需要将这些字符串放在列表中作为参数传递给 set() 函数，示例如下：

myset = set(['one', 'two', 'three'])

2.3 获取集合元素数量

使用 len() 函数可以获取集合中元素的数量，示例如下：

myset = set([1, 2, 3, 4, 5])
print(len(myset))  # 输出: 5

2.4 添加和删除元素

2.4.1 添加元素

使用 add() 方法可以向集合中添加一个元素，如果元素已经存在，不会重复添加，示例如下：

myset = set()
myset.add(1)
myset.add(2)
myset.add(3)

使用 update() 方法可以一次性添加多个元素，参数可以是列表、元组、字符串或另一个集合，示例如下：

myset = set([1, 2, 3])
myset.update([4, 5, 6])

2.4.2 删除元素

可以使用 remove() 或 discard() 方法删除集合中的元素，两者的区别在于：
- remove() 方法在元素不存在时会引发 KeyError 异常。
- discard() 方法在元素不存在时不会引发异常。

示例如下：

myset = set([1, 2, 3, 4, 5])
myset.remove(1)
myset.discard(5)
myset.discard(99)  # 不会引发异常

使用 clear() 方法可以清空集合中的所有元素，示例如下：

myset = set([1, 2, 3, 4, 5])
myset.clear()

2.5 遍历集合

可以使用 for 循环遍历集合中的元素，示例如下：

myset = set(['a', 'b', 'c'])
for val in myset:
    print(val)

2.6 检查元素是否存在

使用 in 和 not in 运算符可以检查集合中是否存在某个元素，示例如下：

myset = set([1, 2, 3])
if 1 in myset:
    print('值 1 存在于集合中')
if 99 not in myset:
    print('值 99 不存在于集合中')

3. 集合运算

3.1 集合的并集

集合的并集是包含两个集合中所有元素的集合。可以使用 union() 方法或 | 运算符来计算并集，示例如下：

set1 = set([1, 2, 3, 4])
set2 = set([3, 4, 5, 6])
set3 = set1.union(set2)
set4 = set1 | set2
print(set3)  # 输出: {1, 2, 3, 4, 5, 6}
print(set4)  # 输出: {1, 2, 3, 4, 5, 6}

3.2 集合的交集

集合的交集是只包含两个集合中共同元素的集合。可以使用 intersection() 方法或 & 运算符来计算交集，示例如下：

set1 = set([1, 2, 3, 4])
set2 = set([3, 4, 5, 6])
set3 = set1.intersection(set2)
set4 = set1 & set2
print(set3)  # 输出: {3, 4}
print(set4)  # 输出: {3, 4}

3.3 集合的差集

集合的差集是包含在一个集合中但不在另一个集合中的元素的集合。可以使用 difference() 方法或 - 运算符来计算差集，示例如下：

set1 = set([1, 2, 3, 4])
set2 = set([3, 4, 5, 6])
set3 = set1.difference(set2)
set4 = set1 - set2
print(set3)  # 输出: {1, 2}
print(set4)  # 输出: {1, 2}

3.4 集合的对称差集

集合的对称差集是包含两个集合中不共享元素的集合。可以使用 symmetric_difference() 方法或 ^ 运算符来计算对称差集，示例如下：

set1 = set([1, 2, 3, 4])
set2 = set([3, 4, 5, 6])
set3 = set1.symmetric_difference(set2)
set4 = set1 ^ set2
print(set3)  # 输出: {1, 2, 5, 6}
print(set4)  # 输出: {1, 2, 5, 6}

3.5 子集和超集检查

可以使用 issubset() 和 issuperset() 方法或 <= 和 >= 运算符来检查一个集合是否是另一个集合的子集或超集，示例如下：

set1 = set([1, 2, 3, 4])
set2 = set([2, 3])
print(set2.issubset(set1))  # 输出: True
print(set1.issuperset(set2))  # 输出: True
print(set2 <= set1)  # 输出: True
print(set1 >= set2)  # 输出: True

4. 集合操作示例

以下是一个示例程序，展示了如何使用集合操作来处理学生体育团队信息：

# 创建集合
baseball = set(['Jodi', 'Carmen', 'Aida', 'Alicia'])
basketball = set(['Eva', 'Carmen', 'Alicia', 'Sarah'])

# 显示棒球队成员
print('The following students are on the baseball team:')
for name in baseball:
    print(name)

# 显示篮球队成员
print()
print('The following students are on the basketball team:')
for name in basketball:
    print(name)

# 显示同时参加两项运动的学生
print()
print('The following students play both baseball and basketball:')
for name in baseball.intersection(basketball):
    print(name)

# 显示参加任意一项运动的学生
print()
print('The following students play either baseball or basketball:')
for name in baseball.union(basketball):
    print(name)

# 显示只参加棒球运动的学生
print()
print('The following students play baseball, but not basketball:')
for name in baseball.difference(basketball):
    print(name)

# 显示只参加篮球运动的学生
print()
print('The following students play basketball, but not baseball:')
for name in basketball.difference(baseball):
    print(name)

# 显示只参加一项运动的学生
print()
print('The following students play one sport, but not both:')
for name in baseball.symmetric_difference(basketball):
    print(name)

4.1 程序输出

The following students are on the baseball team:
Jodi
Aida
Carmen
Alicia
The following students are on the basketball team:
Sarah
Eva
Alicia
Carmen
The following students play both baseball and basketball:
Alicia
Carmen
The following students play either baseball or basketball:
Sarah
Alicia
Jodi
Eva
Aida
Carmen
The following students play baseball but not basketball:
Jodi
Aida
The following students play basketball but not baseball:
Sarah
Eva
The following students play one sport but not both:
Sarah
Aida
Jodi
Eva

5. 总结

通过本文的介绍，我们了解了 Python 中字典和集合的基本概念、操作方法以及集合运算。字典适用于存储键值对数据，方便通过键来快速访问对应的值；而集合则适用于存储唯一值，并且支持各种集合运算，如并集、交集、差集等。在实际编程中，根据具体需求选择合适的数据结构可以提高代码的效率和可读性。

6. 字典和集合的性能分析

6.1 字典的性能

字典是 Python 中非常高效的数据结构，其查找、插入和删除操作的平均时间复杂度为 $O(1)$。这是因为字典使用哈希表来存储键值对，通过键的哈希值可以快速定位到对应的值。

以下是一个简单的性能测试示例，比较使用列表和字典查找元素的时间：

import time

# 创建一个包含 100000 个元素的列表
my_list = list(range(100000))
# 创建一个包含 100000 个元素的字典
my_dict = {i: i for i in range(100000)}

# 测试列表查找元素的时间
start_time = time.time()
if 99999 in my_list:
    pass
end_time = time.time()
list_time = end_time - start_time

# 测试字典查找元素的时间
start_time = time.time()
if 99999 in my_dict:
    pass
end_time = time.time()
dict_time = end_time - start_time

print(f"列表查找时间: {list_time} 秒")
print(f"字典查找时间: {dict_time} 秒")

从上述代码可以看出，字典的查找速度明显快于列表。

6.2 集合的性能

集合同样使用哈希表来存储元素，因此其查找、插入和删除操作的平均时间复杂度也为 $O(1)$。集合的主要优势在于可以快速判断一个元素是否存在于集合中。

以下是一个性能测试示例，比较使用列表和集合判断元素是否存在的时间：

import time

# 创建一个包含 100000 个元素的列表
my_list = list(range(100000))
# 创建一个包含 100000 个元素的集合
my_set = set(range(100000))

# 测试列表判断元素是否存在的时间
start_time = time.time()
if 99999 in my_list:
    pass
end_time = time.time()
list_time = end_time - start_time

# 测试集合判断元素是否存在的时间
start_time = time.time()
if 99999 in my_set:
    pass
end_time = time.time()
set_time = end_time - start_time

print(f"列表判断元素是否存在的时间: {list_time} 秒")
print(f"集合判断元素是否存在的时间: {set_time} 秒")

从上述代码可以看出，集合判断元素是否存在的速度明显快于列表。

6.3 性能总结

数据结构	查找操作	插入操作	删除操作
列表	$O(n)$	$O(n)$	$O(n)$
字典	$O(1)$	$O(1)$	$O(1)$
集合	$O(1)$	$O(1)$	$O(1)$

从性能角度来看，当需要快速查找、插入或删除元素时，字典和集合是更好的选择；而列表则适用于需要按顺序访问元素的场景。

7. 字典和集合的应用场景

7.1 字典的应用场景

数据映射 ：字典可以用于存储键值对，实现数据的映射关系。例如，存储学生的学号和姓名：

students = {
    '001': '张三',
    '002': '李四',
    '003': '王五'
}

配置管理 ：字典可以用于存储配置信息，方便程序读取和修改。例如，存储数据库连接信息：

db_config = {
    'host': 'localhost',
    'port': 3306,
    'user': 'root',
    'password': '123456',
    'database': 'test'
}

7.2 集合的应用场景

去重：集合的元素具有唯一性，可以用于去除列表中的重复元素。例如：

my_list = [1, 2, 2, 3, 4, 4, 4]
unique_list = list(set(my_list))
print(unique_list)  # 输出: [1, 2, 3, 4]

交集、并集、差集运算 ：集合支持交集、并集、差集等运算，可以用于解决一些集合相关的问题。例如，找出两个列表中共同的元素：

list1 = [1, 2, 3, 4]
list2 = [3, 4, 5, 6]
common_elements = list(set(list1).intersection(set(list2)))
print(common_elements)  # 输出: [3, 4]

7.3 应用场景总结

数据结构	应用场景
字典	数据映射、配置管理、缓存等
集合	去重、集合运算、判断元素是否存在等

8. 字典和集合的注意事项

8.1 字典的注意事项

键的不可变性 ：字典的键必须是不可变的，例如字符串、数字或元组。如果使用可变对象作为键，会引发 TypeError 异常。

# 错误示例：使用列表作为键
my_dict = {[1, 2]: 'value'}  # 会引发 TypeError 异常

键的唯一性 ：字典的键必须是唯一的，如果重复插入相同的键，后面的值会覆盖前面的值。

my_dict = {'key': 'value1'}
my_dict['key'] = 'value2'
print(my_dict['key'])  # 输出: value2

8.2 集合的注意事项

元素的不可变性 ：集合的元素必须是不可变的，例如字符串、数字或元组。如果使用可变对象作为元素，会引发 TypeError 异常。

# 错误示例：使用列表作为集合元素
my_set = set([[1, 2]])  # 会引发 TypeError 异常

无序性 ：集合中的元素是无序的，不能通过索引来访问元素。如果需要按顺序访问元素，建议使用列表。

9. 总结与展望

9.1 总结

本文详细介绍了 Python 中字典和集合的基本概念、操作方法、集合运算、性能分析、应用场景以及注意事项。字典适用于存储键值对数据，方便通过键来快速访问对应的值；而集合则适用于存储唯一值，并且支持各种集合运算，如并集、交集、差集等。在实际编程中，根据具体需求选择合适的数据结构可以提高代码的效率和可读性。

9.2 展望

字典和集合是 Python 中非常重要的数据结构，在实际开发中有着广泛的应用。随着 Python 的不断发展，字典和集合的功能也可能会不断增强。例如，未来可能会支持更多的集合运算操作，或者优化字典和集合的性能。同时，在大数据和人工智能领域，字典和集合也将发挥重要的作用，例如用于数据处理、模型训练等。

在未来的学习和实践中，我们可以进一步探索字典和集合的高级用法，结合其他数据结构和算法，解决更加复杂的问题。