
目录
(.)中的数字表示数量。
教程(4)
获奖论文摘要(3)
可控图像合成(2)
不平衡样本处理(2)
多任务学习(1)
表示学习(2)
自我监督学习(2)
半监督学习(2)
弱监督学习(用于语义分割)(3)
目标检测(2)
知识提炼(三)
数据扩充(4)
优化(3)
评价与概括(3)
不确定度估计(3)
[Tutorial | Sun.] How to write a good paper? — Bill Freeman (MIT, Google)
视频:(https://www.youtube.com/watch?v=W1zPtTt43LI&t=467s)
题目:如何写一篇好论文
为什么它很重要?一篇有创意的,原创的,非常强的论文会比那些还可以的、糟糕的论文更影响你的职业生涯:让你的努力变得有价值。
陈述你的问题,让读者知道你解决的问题是什么;其他的解决方案是什么,为什么其它方案不行;解释你自己的解决方案以及为什么它更好;用简单的例子传达主要思想;在实验中进行合理的比较;最后总结一下你的成果会带来什么应用或贡献,或者它如何改变我们处理问题的方式;还有以“未来的工作”结束是个坏主意(即,我们想做,但未能在截止日期前及时做完)。
使你的论文易于阅读(在匆忙中仍能学到要点);写出简洁的句子(即,不要冗长!);数字和标题应该是独立的。
积极的语调-要和蔼可亲:不要过度推销,隐藏缺点和贬低他人的工作;诚实地指出局限性。
一个好标题很重要。
会议期刊拒绝论文的理由:没有兑现论文的承诺;遗漏重要参考文献;太多或令人难以置信的结果;写得不好;陈述不正确;写得很好但却枯燥乏味的论文;虽然新颖精彩容易指出缺点的论文。
好的写作就是重新写作。所以要早点开始写论文。
[Tutorial | Sun.] All You Need to Know About Self-Driving by Uber ATG
链接:(http://www.allaboutselfdriving.com/)
题目:由Uber ATG提供你想了解的关于自动驾驶的信息
本教程涵盖了自动驾驶管道中的主要技术组件,包括不同传感器模式的数据预处理、三维物体检测的感知、长期预测、行驶轨迹规划、转向和加速等控制以及车辆与车辆之间的通信。这里我只记录了传感器的形态和感知。
传感器模态和感知(3D物体检测)
激光雷达(3D):
-
点云表示,如3D体素(3D卷积有效的特征提取;昂贵的计算和内存消耗;CVPR'18的VoxelNet):https://arxiv.org/abs/1711.06396
距离视图(保留全范围信息;由于3D信息丢失而导致邻域不真实;CVPR'19的LaserNet):https://arxiv.org/abs/1903.08701
鸟瞰图(2D卷积的有效特征提取;内存消耗昂贵;CVPR'19的PointPillars):https://arxiv.org/abs/1812.04244
3D点集(精确定位;昂贵的计算和内存消耗;多尺度特征的次优关键点;CVPR'19的PointRCNN):https://arxiv.org/abs/1812.04244
这些表示大多是稀疏的,可以通过使用稀疏卷积网络或稀疏块网络(CVPR'18)来加速。:https://arxiv.org/abs/1801.02108
摄像机(2D):比激光雷达便宜。将2D输入/特征/输出转换为3D,然后使用现有的探测器。
-
转换为3D输出:2D关键点预测+3D盒子模板匹配=3D盒子输出(性能不理想);
转换3D输入:2D图像+深度估计=“伪激光雷达”(SoTA基于图像的3D感知;由于需要深度模型而产生的额外计算成本;ICLR'20的伪激光雷达++和CVPR'20的E2E伪激光雷达):https://arxiv.org/abs/1906.06310与https://arxiv.org/abs/2004.03080
转换到3D特征:根据相机内部特性将2D特征映射到3D(鸟眼)特征(无需深度估计;深度模糊导致的3D特征误差;BMVC'19的正交特征转换):https://arxiv.org/abs/1811.08188
传感器融合-激光雷达+摄像机:融合可以在输入/特征/输出中以级联或并行的方式发生。
传感器融合-雷达(几何结构)+摄像机(性能无法与基于激光雷达的系统相匹配);雷达(作为速度)+激光雷达。请参阅arXiv'20的“Exploiting Radar for Robust Perception of Dynamic Objects”。
高清地图:语义信息。主要用于运动规划系统。几何方面,请参见CoRL'18的HDNet(http://proceedings.mlr.press/v87/yang18b/yang18b.pdf?utm_source);作为rasters,请参阅WACV'20的Uncertainty-aware Short-term Motion Prediction of Traffic Actors for Autonomous Driving(https://arxiv.org/abs/1808.05819);作为车道图(更直观但更复杂的模型设计),请参见CVPR'20的VectorNet(https://arxiv.org/abs/2005.04259)。
[Workshop | Mon.] Scalability in Autonomous Driving
题目:自动驾驶的可扩展性
链接:https://sites.google.com/view/cvpr20-scalability
第一名的解决方案报告令人印象深刻,他们花了2个月才获得第一名。他们的系统中的许多组件似乎都得到了集中的优化,而且还应用了一些新的技巧。
[Keynote]Raquel Urtasun,Uber ATG的 Scalable Simulation for Self Driving
仿真可用于训练和安全评估。完整的模拟包括状态(参与者行为)、几何体(参与者和环境三维模型)和观察(自动驾驶汽车感知的激光雷达和摄像机表示)。
状态:ActorSim(http://makro.ink/actorsim/) (现实性和多样性)。
几何状态+激光雷达传感模拟:CARLA(https://carla.org/)(设计3D参与者资产耗时;环境多样性有限;不切实际;CoRL'17);Blensor(ht