原文:论文
代码:github
这个队伍的想法很创新,首先他对于SCT,没有采用深度学习提取特征的这种方法,而是偏向使用图像图形学的知识,而且对于mtmc的处理,大部分论文使用了聚类的办法,但是它采用了计算非训练的方法,经由reid之后,去一一匹配。
下面说一下他的创新点:首先进行相机校准。
为什么要进行相机校准呢:在多镜头多目标的追踪下,需要利用不同镜头下的物体视觉信息,减少被遮挡区域,并且提供目标和场景的3D信息,相机视图对于3D场景有畸变作用,比如你不能确定远处的物体到底有多远,所以要使用相机校准还原3D场景。
相机校准
现附上一位大佬的博客吧:3D重建之相机校准
简而言之,相机拍照会经历3个坐标系:图像坐标系,相机坐标系,世界坐标系。相机的参数分为两个:相机内参和相机外参,内参用于相机坐标系投影到图像像素,外参用于将世界坐标系投影到相机坐标系。内参一般是不随时间变化的,可以通过matlab等校准工具求得,外参需要在实际过程中求得。
在这个比赛里,他们对相机校准进行了优化,首先他们在相机图像上选了n段直线,记录他们的坐标(x,y),然后通过参数矩阵把它投到了3D中,然后使用了Google map来获取真实制的坐标,并且计算预估值和真实值的误差,来反复校准相机参数(E