【动手学深度学习】1.2 预备知识 使用 pandas 处理数据

目录

数据预处理        

处理缺失值NaN

转换为张量格式


数据预处理        

        当利用深度学习来解决现实世界的问题时,我们需要预处理原始数据,并将原始数据转换为张量格式。在 Python 中常用的数据分析工具中,通常使用 pandas 软件包,它与张量的数据格式兼容。以下为使用 pandas 案例:

        首先创建一个人工数据集,并存储在CSV(逗号分隔值)文件 house_tiny.csv 中。 以其他格式存储的数据也可以通过类似的方式进行处理。 

import os

# 递归创建 ../data 目录。
os.makedirs(os.path.join('..', 'data'), exist_ok=True)
# os.path.join('..', 'data'):
# '..':表示上一级目录(父目录), 'data' 表示当前目录下的 data 文件夹。
# os.path.join是 Python 的 os.path 模块中的一个函数,用于将多个路径组件连接成一个完整的路径。
# 故该语句作用是生成路径 ../data

# os.makedirs(path, mode=0o777, exist_ok=False):
# os.makedirs 是 Python 的 os 模块中的
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值