
transormer系列
文章平均质量分 83
FourierTransformer
这个作者很懒,什么都没留下…
展开
-
BEVFormer组件分析
而现在的refer points 是由 虚拟的grid points往图像上投影得到的. 在相机参数固定的情况下, 此时的refer points是固定的.另外, 显然这样虚拟的grid points 是不合理的, 因为有些地方可能就没有点, 但是还是能够投影到图像上的. 这里用真值的点应该会更好,问题: 给固定的这些refer points 的收益是多大?下面是 SpatialCrossAttention这个模块的forward函数的部分代码。根据上面的代码可以看出来,如果输入的是3d, 则是。原创 2023-06-04 19:09:29 · 1443 阅读 · 1 评论 -
从代码角度理解DETR
把目标检测视为一个集合预测问题. 从设计上去掉了很多的人为操作,比如anchor设定, nms 等.更关注object与image context 之间的本质, 直接去预测最终的结果集合. 而非"搜索式检测"不需要开发额外的库,比如roi-align, roi-pooling, 这些操作…很容易换一个head就可以去做分割的任务,原创 2023-05-27 21:09:30 · 900 阅读 · 0 评论 -
从代码层面理解Transformer
这个模块其实没有可以学习的参数.这里的这个buffer的用法可以学习一下.这里的这个实现还是挺简洁的. 一行就解决了.原创 2023-05-21 17:41:29 · 501 阅读 · 0 评论