11、时间序列与文本数据处理：从数据到张量的转换

时间序列与文本数据的张量转换技术

最新推荐文章于 2025-08-21 08:43:02 发布

onion

最新推荐文章于 2025-08-21 08:43:02 发布

阅读量41

点赞数

CC 4.0 BY-SA版权

分类专栏： PyTorch深度学习实战文章标签：时间序列数据文本数据处理张量转换

本文链接：https://blog.youkuaiyun.com/onion/article/details/151034104

PyTorch深度学习实战专栏收录该内容

51 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

时间序列与文本数据处理：从数据到张量的转换

1. 时间序列数据处理

1.1 数据概述

在之前的处理中，我们接触到的数据以扁平表格形式呈现，表格中的每一行相互独立，行的顺序对数据本身没有影响，即不存在用于标识行先后顺序的列。不过，以葡萄酒数据集为例，如果有“年份”列，我们就能逐年观察葡萄酒品质的变化。可惜目前我们没有这样的数据，但正在努力逐瓶手动收集样本。当下，我们将转向另一个有趣的数据集——华盛顿特区自行车共享系统的数据。该数据集记录了 2011 - 2012 年 Capital Bikeshare 系统每小时的自行车租赁数量，同时包含天气和季节信息，可从这里获取。我们的目标是把这个二维扁平数据集转换为三维数据集。

1.2 添加时间维度

源数据中，每行代表一个小时的数据。我们要改变这种按小时排列的方式，使一个轴以每天为单位递增，另一个轴表示一天中的小时数（与日期无关），第三个轴则对应不同的数据列，如天气、温度等。
以下是加载数据的代码：

import numpy as np
import torch

# In[2]:
bikes_numpy = np.loadtxt(
    "../data/p1ch4/bike-sharing-dataset/hour-fixed.csv",
    dtype=np.float32,
    delimiter=",",
    skiprows=1,
    converters={1: lambda x: floa

会员秒杀 ¥9.9 重磅福利

超级会员免费看