- 博客(4)
- 收藏
- 关注
原创 Transformer 多模态
Multimodal Transformer for Unaligned Multimodal Language Sequences摘要:人类语言往往是多模态的,包括自然语言,表情以及声学行为。但对时间语言序列进行多模态建模存在以下两个主要挑战:1.不同模态的数据在时间上是不对齐的,这里不对齐一是采样率不同,二是不同模态数据采集的起始时间未必对齐2.不同模态之间的长期依赖问题文章提出了Multimodal Transformer(MulT)来解决上述问题。模型分析:整体结构如下图
2021-03-18 22:24:32
5872
原创 卷积网络输出大小计算公式
Out = floor[(n+2*p-f)/s]+1其中,floor为向下取整,n是输入尺寸,p为padding,f为卷积核大小,s为步长
2020-12-28 20:36:43
356
转载 Tensorfow2.0不能使用get_session问题
RuntimeError: `get_session` is not available when using TensorFlow 2.0.yolov3中源代码有这样:self.sess = K.get_session()报错显示tf2.0以上移除了这函数,网上大部分方法都是降低tf版本,参考了一篇博文,解决如下:将self.sess = K.get_session()改为self.sess = tf.compat.v1.Session()...
2020-05-16 01:33:30
5498
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人