字典与集合

本文介绍了如何使用字典推导和collections模块中的defaultdict、Counter来简化数据处理。涵盖了键默认值设置、散列表原理及应用,以及集合的去重和操作。适合理解Python中高效数据结构的开发者。

字典推导

DIAL_CODES = [(86, 'China'),(91, 'India'),(1, 'United States')]
country_code = {country: code for code, country in DIAL_CODES}

用setdefault处理找不到的键

# 如果key不存在,把key和一个空列表放进映射,然后返回这个空列表
my_dict.setdefault(key, []).append(new_value)

defaultdict:处理找不到的键的一个选择

  • collections.defaultdict创建找不到时的默认值
# 如果index没有key的记录,default_factory会被调用,为查询不到的键创建一个值。
index = collections.defaultdict(list)

字典的变种

  • collections.Counter:会给键准备一个整数计数器。每次更新一个键的时候都会增加这个计数器。
# 每个字母出现的次数
ct = collections.Counter('asdfasdfasdf')
ct.update('aaaafffgggzzz')
# 出现最多的前2个
ct.most_common(2)

不可变映射类型

  • types.MappingProxyType:给这个类一个映射,返回只读的映射视图,且是动态的。
from types import MappingProxyType
d = {1: 'A'}
d_proxy = MappingProxyType(d)
# d_proxy[2] = 'x' 会抛出TypeError
d[2] = 'B'
# d_proxy会跟d动态改变
d_proxy[2]

集合

  • 可以用于去重
  • needles的元素在haystack里出现的次数,要求都是set类型。
found = len(needles & haystack)
# 任何可迭代对象
found = len(set(needles) & (set(haystack))
  • 空集合表示:set()
  • 反汇编函数dis.dis查看字节码
from dis import dis
dis('{1}')
# 用列表构建较慢,需要新建一个列表,再把这个列表传入到构造方法。
dis('[1]')
  • 集合推导
{i for i in range(5)}

字典中的散列表

  • 散列表是一个稀疏数组。
  • dict的实现及其导致的结果
    • 键必须是可散列的
    • 字典在内存上的开销巨大,可以用元组或具名元组构成的列表替代,避免了散列表所耗费的空间和无需把记录中的字段的名字在每个元素里都存一遍。
    • 键查询很快,空间换时间
    • 键的次序取决于添加顺序,但是当添加新建又发生散列冲突的时候,新键可能会被按排存放到另一个位置。
    • 往字典里添加新键可能会改变已有键的顺序,所以,不要对字典同时进行迭代和修改。
  • set的实现以及导致的结果
    • 集合里的元素必须是可散列的
    • 集合很消耗内存
    • 可以很高效的判断元素是否存在于某个集合
    • 元素的次序取决于被添加到集合里的次序
    • 往集合里添加元素,可能会改变集合里已有元素的次序

流畅的python2015

<think>我们被要求回答关于Python字典集合的介绍、使用方法及区别。根据提供的引用,我们可以总结如下: 1. 字典(dict): - 是一种映射类型,存储键值对(key-value pairs)。 - 键(key)必须是不可变对象(如字符串、数字、元组等),不能是可变对象(如列表、字典)。 - 字典是无序的(在Python 3.6+中,字典保持插入顺序,但本质上是为映射而设计,不应依赖顺序)。 - 通过键来索引,若键不存在则引发KeyError异常。 - 创建空字典:`d = {}` 或 `d = dict()`。 - 字典的查找速度非常快,因为底层实现是哈希表。 2. 集合(set): - 集合是一种无序的、不重复元素的集合。 - 有两种类型:可变集合(set)不可变集合(frozenset)。set可以添加、删除元素,而frozenset不能。 - 创建空集合必须使用`set()`,因为`{}`表示空字典。 - 集合的元素必须是不可变对象(可哈希的),因此可以包含数字、字符串、元组等,但不能包含列表、字典等可变对象。 - 集合支持数学上的集合操作,如并集、交集、差集等。 区别: - 字典存储键值对,集合只存储唯一的元素(没有键值对应)。 - 字典通过键来访问值,集合没有键的概念,只能检查元素是否存在。 - 空集合的创建方式不同:集合用`set()`,字典用`{}`。 使用方法示例: - 字典:定义、访问、添加、删除、遍历等。 - 集合:创建、添加元素、删除元素、集合运算(并、交、差等)以及常用方法(如`add`, `remove`, `union`, `intersection`等)。 另外,引用中提到了字典集合的一些常用函数,如`all()`, `any()`, `len()`, `max()`, `min()`, `sorted()`, `sum()`等,这些函数对集合字典(对字典操作时,默认操作键)都适用。 根据以上信息,我们可以组织回答。 </think> ### Python字典集合详解 #### 一、字典(Dictionary) 1. **定义特性** 字典是键值对(key-value)的映射结构,语法为 `{key1: value1, key2: value2}`。 - 键(key)必须是**不可变对象**(如字符串、数字、元组),不能使用列表、字典等可变对象[^1][^2]。 - 值(value)可为任意对象。 - 无序存储(Python 3.6+ 保留插入顺序,但本质仍是映射结构)。 - 空字典创建:`d = {}`。 2. **核心操作** ```python # 创建访问 user = {"id": 101, "name": "Alice", "age": 25} print(user["name"]) # 输出: Alice # 避免KeyError的访问 print(user.get("email", "N/A")) # 键不存在时返回默认值 # 修改添加 user["age"] = 26 # 修改值 user["email"] = "a@test.com" # 添加新键值对 # 删除 del user["id"] # 删除键值对 ``` 3. **优势** 基于哈希表实现,**键查找速度极快**(时间复杂度 $O(1)$),适合高频检索场景[^2]。 --- #### 二、集合(Set) 1. **定义特性** 集合存储**唯一不可变元素**的无序容器,语法为 `{item1, item2}`。 - 元素必须是不可变对象(同字典键的要求)[^3][^4]。 - 空集合创建:`s = set()`(`{}` 表示空字典)[^3]。 - 两种类型: - `set`:可变集合,可增删元素。 - `frozenset`:不可变集合。 2. **核心操作** ```python # 创建修改 s = {1, 2, 3} s.add(4) # 添加元素 s.remove(1) # 删除元素(元素不存在时报错) # 集合运算 a = {1, 2, 3} b = {3, 4, 5} print(a | b) # 并集: {1, 2, 3, 4, 5} print(a & b) # 交集: {3} ``` 3. **常用函数** `len()`, `max()`, `min()`, `sum()` 等支持集合操作[^5]。 ```python nums = {5, 2, 8} print(sorted(nums)) # 返回排序列表: [2, 5, 8] ``` --- #### 三、字典集合的区别 | **特性** | 字典(dict) | 集合(set) | |----------------|-----------------------|----------------------| | 存储内容 | 键值对(key-value) | 唯一元素(无键值) | | 空对象创建 | `d = {}` | `s = set()` | | 元素要求 | 键必须不可变 | 所有元素必须不可变 | | 主要用途 | 通过键快速检索值 | 去重、集合运算 | | 索引方式 | 通过键索引(如`d["k"]`)| 只能检测元素是否存在 | > **关键区别示例**: > - 字典通过键映射值:`user["name"]` 获取用户名。 > - 集合检查元素存在性:`if 3 in my_set:`。 --- #### 四、典型应用场景 1. **字典** - 数据库记录(如用户信息) - JSON数据解析 - 缓存系统(键值存储) 2. **集合** - 数据去重(如`unique_words = set(text.split())`) - 关系运算(交集求共同好友) - 成员快速检测(替代列表提升效率)
评论 3
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值