【动手学深度学习】1.2 预备知识使用 pandas 处理数据

KK_code_2025

已于 2025-02-20 11:21:44 修改

阅读量401

点赞数 6

文章标签：深度学习人工智能 pytorch

于 2025-02-19 23:46:28 首次发布

本文链接：https://blog.youkuaiyun.com/csdnkk0103/article/details/145716568

版权

数据预处理

处理缺失值NaN

转换为张量格式

数据预处理

当利用深度学习来解决现实世界的问题时，我们需要预处理原始数据，并将原始数据转换为张量格式。在 Python 中常用的数据分析工具中，通常使用 pandas 软件包，它与张量的数据格式兼容。以下为使用 pandas 案例：

首先创建一个人工数据集，并存储在CSV（逗号分隔值）文件 house_tiny.csv 中。以其他格式存储的数据也可以通过类似的方式进行处理。

import os

# 递归创建 ../data 目录。
os.makedirs(os.path.join('..', 'data'), exist_ok=True)
# os.path.join('..', 'data')：
# '..'：表示上一级目录（父目录）, 'data' 表示当前目录下的 data 文件夹。
# os.path.join是 Python 的 os.path 模块中的一个函数，用于将多个路径组件连接成一个完整的路径。
# 故该语句作用是生成路径 ../data

# os.makedirs(path, mode=0o777, exist_ok=False):
# os.makedirs 是 Python 的 os 模块中的