自然界种存在很多事物是与时间有关的或者是序列表示的,这种事物我们都可以在pytorch种用tensor进行序列化表示,形式如[seq_len,feature_len]代表一个事物种序列的数量,以及每个序列的长度。举例说明:
1、月份-房价
对此例,用一个标量就可以表示一个序列。
2、图片
想象成对其一行行扫描,每一行是一个序列,行数是序列的数量。
3、文本信息
要表示一个句子,第一个维度表示单词数量,第二个维度是每个单词的编码。
one-hot编码,每个向量只有一个1,其余都是0。
3.1 one-hot编码的问题有很多,它维度太高,无法表示单词之间的相似度等信息。主流的编码方式有word2vec和glove,可以将单词转化为指定长度的vector。
一般多个序列同时处理,和图像数据一样,也有batch的概念。