tf.keras.layers.Conv1D(filters=3, kernel_size=2, activation='relu',use_bias=True)
其中,filters参数表示,将输入的每一个窗口数据经过几个过滤器输出,其中每一个过滤器表示一个映射方式,定义为g(x);可以类似深度网络中每一层的维度数,原理如下图所示

kernel_size:卷积的窗口大小,由于是Cov1D,即1维卷积
一个完整句子的卷积处理过程如下:

所以当输入一个(batch_size,token_size,embedding_size)的数据时,通过对每一个句子的token卷积 输出为:(batch_size,token_size-kernel_size+1,filters)
举例,比如一个batch下的数据,卷积过程为:

滤波器在矩阵指定方向上滑动,对应位置相乘求和

本文详细解析了一维卷积层(Conv1D)的工作原理及其参数设置,包括filters和kernel_size的具体含义。通过实例说明了如何对输入数据进行卷积操作,并解释了输出数据形状的变化。
1575





