2021年11月7日-地平线视觉算法工程师面试题4道

本文介绍了2021年11月7日地平线视觉算法工程师面试的四道题目,涉及Mask-RCNN算法历史、L1和L2正则化的区别、CV中Transformer的发展以及位置编码的解释。Mask-RCNN的亮点包括RoiAlign和掩模预测解耦;L1正则化倾向于产生稀疏解,L2则得到平滑解;Transformer在CV领域的应用如ViT、DETR和Swin Transformer;位置编码在CV中对于回归任务的重要性被讨论。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目来源:七月在线学员的社区分享,答案供大家参考,欢迎评论区交流指正。

1、Mask-rcnn介绍一下

敲黑板:谈到Mask-rcnn,不如说这是一道考验介绍算法的陈述题。面试官会根据你简历做的算法or你提到的算法(恰好他也熟悉的Hhh)进行提问要你介绍,说明。这里不要求同学们说的多么仔细,我建议可以这样回答

1.它基于的历史:双阶段检测器faster-rcnn+语义分割分支

2.它的最大几个idea,让你眼前一亮或是和你的项目论文关联度比较大的创新点

2.1: 解决特征图与原始图像上的RoI不对齐问题 :即Roi_align:传统的proposals在生成固定长度的roi的过程由于二次量化时造成的位置精度损失以及双线性插值法回去看paper!!!

2.2 掩模预测和分类预测解耦:参考Nms的类内抑制,对于实例分割的每个类别独立地预测一个二值掩模,每个二值

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值