目录
数据预处理
当利用深度学习来解决现实世界的问题时,我们需要预处理原始数据,并将原始数据转换为张量格式。在 Python 中常用的数据分析工具中,通常使用 pandas 软件包,它与张量的数据格式兼容。以下为使用 pandas 案例:
首先创建一个人工数据集,并存储在CSV(逗号分隔值)文件 house_tiny.csv 中。 以其他格式存储的数据也可以通过类似的方式进行处理。
import os
# 递归创建 ../data 目录。
os.makedirs(os.path.join('..', 'data'), exist_ok=True)
# os.path.join('..', 'data'):
# '..':表示上一级目录(父目录), 'data' 表示当前目录下的 data 文件夹。
# os.path.join是 Python 的 os.path 模块中的一个函数,用于将多个路径组件连接成一个完整的路径。
# 故该语句作用是生成路径 ../data
# os.makedirs(path, mode=0o777, exist_ok=False):
# os.makedirs 是 Python 的 os 模块中的