- 序列数据包括时间序列以及串数据,常见的序列有时时序数据、文本数据、语音数据等。处理序列数据的模型成为序列模型。序列模型是自然语言处理中的一个核心模型,依赖时间信息。传统机器学习方法中序列模型有隐马尔科夫模型(Hidden Markow Model,HMM)和条件随机场(Conditional Random Field.CRF)都是概率图模型,其中HMM在语音识别和文字识别领域应该广泛,CRF被广泛用于分词、词性标注和命名实体识别问题。
- 神经网络处理序列数据。帮助我们从已知的数据中预测未来的模型,在模式识别取得很好的效果。作为预测未来模式的神经网络有窥视未来的本领,比方说可以根据过去几天的股票价格来预测股票的趋势。在前馈神经网络中对于特定的输入都会有相同输出,所以我们要正确的对输入信息进行编码。对时间序列数据的编码很多,其中,最简单、应用最广泛的编码时基于滑动窗口的方法。