利用循环神经网络对序列数据进行建模
1. 序列数据简介
1.1 序列数据的独特性
与其他类型的数据不同,序列数据中的元素按特定顺序出现,且相互依赖。典型的监督学习机器学习算法通常假设输入数据是独立同分布(IID)的,即训练示例相互独立且具有相同的底层分布。例如在鸢尾花数据集中,每朵花的测量值相互独立,一朵花的测量值不会影响另一朵花的测量值。
然而,在处理序列数据时,顺序至关重要。以预测某只股票的市场价值为例,如果要预测未来三天的股票市值,按日期排序考虑之前的股票价格来推导趋势是合理的,而不是随机使用这些训练示例。
1.2 序列数据与时间序列数据
时间序列数据是一种特殊的序列数据,其中每个示例都与时间维度相关联。在时间序列数据中,样本是在连续的时间戳上采集的,因此时间维度决定了数据点之间的顺序。例如,股票价格和语音记录都是时间序列数据。
1.3 序列的表示
在机器学习模型中,为了利用序列数据的顺序信息,我们将序列表示为〈𝒙(1), 𝒙(2), … , 𝒙(𝑇)〉,其中上标索引表示实例的顺序,序列的长度为 T。对于时间序列数据,每个示例点 𝑥(𝑡) 都对应一个特定的时间 t。
标准的神经网络模型,如多层感知机(MLP)和用于图像数据的卷积神经网络(CNN),假设训练示例相互独立,因此不包含顺序信息。而循环神经网络(RNN)则是为建模序列数据而设计的,能够记住过去的信息并相应地处理新事件,这在处理序列数据时具有明显优势。
并非所有的序列数据都具有时间维度,例如文本数据或 DNA 序列,这些示例是有序的,但不属于时间序列数据。不过,RNN 也可用
超级会员免费看
订阅专栏 解锁全文
9423

被折叠的 条评论
为什么被折叠?



