元组
元组的特点:
- 有序,可以重复,这一点和列表一样
- 元组中的元素不能修改,这一点非常重要,深度学习场景中很多参数、形状定义好了确保后续不能被修改。
很多流行的 ML/DL 库(如 TensorFlow, PyTorch, NumPy)在其 API 中都广泛使用了元组来表示形状、配置等。
可以看到,元组最重要的功能是在列表之上,增加了不可修改这个需求
元组的创建
my_tuple1 = (1, 2, 3)
my_tuple2 = ('a', 'b', 'c')
my_tuple3 = (1, 'hello', 3.14, [4, 5]) # 可以包含不同类型的元素
print(my_tuple1)
print(my_tuple2)
print(my_tuple3)
(1, 2, 3) ('a', 'b', 'c') (1, 'hello', 3.14, [4, 5])
# 可以省略括号
my_tuple4 = 10, 20, 'thirty' # 逗号是关键
print(my_tuple4)
print(type(my_tuple4)) # 看看它的类型
# 创建空元组
empty_tuple = ()
# 或者使用 tuple() 函数
empty_tuple2 = tuple()
print(empty_tuple)
print(empty_tuple2)
(10, 20, 'thirty') <class 'tuple'>
() ()
元组的常见用法
# 元组的索引
my_tuple = ('P', 'y', 't', 'h', 'o', 'n')
print(my_tuple[0]) # 第一个元素
print(my_tuple[2]) # 第三个元素
print(my_tuple[-1]) # 最后一个元素
# 元组的切片
my_tuple = (0, 1, 2, 3, 4, 5)
print(my_tuple[1:4]) # 从索引 1 到 3 (不包括 4)
print(my_tuple[:3]) # 从开头到索引 2
print(my_tuple[3:]) # 从索引 3 到结尾
print(my_tuple[::2]) # 每隔一个元素取一个
# 元组的长度获取
my_tuple = (1, 2, 3)
print(len(my_tuple))
管道工程中pipeline类接收的是一个包含多个小元组的 列表 作为输入。
可以这样理解这个结构:
- 列表 []: 定义了步骤执行的先后顺序。Pipeline 会按照列表中的顺序依次处理数据。之所以用列表,是未来可以对这个列表进行修改。
- 元组 (): 用于将每个步骤的名称和处理对象捆绑在一起。名称用于在后续访问或设置参数时引用该步骤,而对象则是实际执行数据转换或模型训练的工具。固定了操作名+操作
不用字典因为字典是无序的。
可迭代对象
可迭代对象 (Iterable) 是 Python 中一个非常核心的概念。简单来说,一个可迭代对象就是指那些能够一次返回其成员(元素)的对象,让你可以在一个循环(比如 for 循环)中遍历它们。
Python 中有很多内置的可迭代对象,目前我们见过的类型包括:
-
序列类型 (Sequence Types):
list
(列表)tuple
(元组)str
(字符串)range
(范围)
-
集合类型 (Set Types):
set
(集合)
-
字典类型 (Mapping Types):
dict
(字典) - 迭代时返回键 (keys)
-
文件对象 (File objects)
-
生成器 (Generators)
-
迭代器 (Iterators) 本身
OS 模块
随着深度学习项目变得越来越大、数据量越来越多、代码结构越来越复杂,你会越来越频繁地用到 os 模块来管理文件、目录、路径,以及进行一些基本的操作系统交互。虽然深度学习的核心在于模型构建和训练,但数据和模型的有效管理是项目成功的关键环节,而 os 模块为此提供了重要的工具。
在简单的入门级项目中,你可能只需要使用 pd.read_csv() 加载数据,而不需要直接操作文件路径。但是,当你开始处理图像数据集、自定义数据加载流程、保存和加载复杂的模型结构时,os 模块就会变得非常有用。
好的代码组织和有效的文件管理是大型深度学习项目的基石。os 模块是实现这些目标的重要组成部分。
获取当前工作目录
import os
os.getcwd()# get current working directory 获取当前工作目录的绝对路径
'd:\\Trae CN\\python打卡'
获取当前工作目录下的文件列表
os.listdir()#列出当前目录下的所有文件和文件夹
['beijing.csv',
'data.xlsx',
'heart.csv',
'第七天.ipynb',
'第三天.ipynb',
'第九天.ipynb',
'第二十三天.ipynb',
'第二十四天.ipynb',
'第二十天.ipynb',
'第五天.ipynb',
'第八天.ipynb',
'第六天.ipynb',
'第十一天.ipynb',
'第十七天.ipynb',
'第十三天.ipynb',
'第十九天.ipynb',
'第十五天.ipynb',
'第十八天.ipynb',
'第十六天.ipynb',
'第十四天.ipynb',
'第十天.ipynb',
'第四天.ipynb']
# 我们使用