百度2019计算机视觉题目问答题

最新推荐文章于 2024-07-15 11:53:08 发布

原创最新推荐文章于 2024-07-15 11:53:08 发布 · 1.1k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#计算机视觉

面试专栏收录该内容

57 篇文章

订阅专栏

关于K-means聚类算法，请回答以下问题：

K-means是有监督聚类还是无监督聚类？（2分）
写出将N个样本（X=(x1,…,xN)）聚成K类的K-means聚类算法的优化目标函数。（6分）
请用伪代码写出聚类过程。（8分）
假设样本特征维度为D，请描述Kmeans算法时间复杂度。（4分）

参考答案：

无监督
对于样本 $x_i$ ，计算其分类： $c_{i}=\operatorname{argmin}\left\|x_{i}-u_{j}\right\|^{2}$
$c_i$ 表示类别， $u_j$ 表示质心
那么优化目标函数可以表示为： $\sum_{i}^{N}\left\|x_{i}-u_{i}\right\|^{2}$
$N$ 表示样本量， $u_i$ 表示 $c_i$ 的质心

def Kmeans (输入数据，类簇的个数K):
    初始计算K个质心点
    repeat迭代
        计算数据中每个点到各个质心的距离，按照最短距离原则划分为同一个簇，最后得到K个类簇
        重新计算K个类簇的质心
    until所有样本的类簇不发生改变或达到最大迭代次数

假设数据量为N，数据维度为D，K为簇的个数，I为迭代次数，那么Kmeans算法的时间复杂度为 N*D*K*I

相机模型有哪些参数，写出三维空间点到图像坐标投影公式。镜头畸变系数有哪几种，对应畸变矫正的公式表达？

参考答案：

相机模型的内参数主要有：主点，焦距，畸变系数。（3分）

三维空间点到二维图像的投影公式：（10分）

镜头畸变：径向畸变和切向畸变。（2分）

$\left[\begin{array}{l}x \\ y \\ w\end{array}\right]=\left[\begin{array}{lll}f_{x} & 0 & c_{x} \\ 0 & f_{y} & c_{y} \\ 0 & 0 & 1\end{array}\right]\left[\begin{array}{l}x \\ Y \\ z\end{array}\right]$

径向畸变矫正公式表达：（3分）

$x_{\text {corrected }}=x\left(1+k_{1} r^{2}+k_{2} r^{4}+k_{3} r^{6}\right)$
$y_{\text {corrected }}=y\left(1+k_{1} r^{2}+k_{2} r^{4}+k_{3} r^{6}\right)$

切向畸变矫正公式表达：（2分）

$x_{\text {corrected }}=x+\left[2 p_{1} x y+p_{2}\left(r^{2}+2 x^{2}\right)\right]$
$y_{\text {corrected }}=y+\left[p_{1}\left(r^{2}+2 y^{2}\right)+2 p_{2} x y\right]$

系统设计题（20分）

在自动驾驶领域，障碍物的空间位置是很重要的信息。在不具备雷达等有测距能力传感器的情况下，如何仅通过单目相机计算出地面上目标的距离？

参考答案：
主要有两种方式来生成IPM图像

方案一：假设地面是平的，采用直接计算单应矩阵H投影的方式。手动或自动选取图像和三维空间点对应的4组标记点，计算出原始图像到IPM变换图像的单应矩阵H。因此图像坐标系中地平面上的任一点，乘以H矩阵后都可以计算出真实三维空间下的坐标。

方案二：同样需要地面是平的假设，通过标定出相机的内参数和外参数，投影换算出图像地平面和三维空间的关系。能够给出公式推导加分。

目前通过卷积神经网络进行检测的方法主要分为one-stage和two-stage，分别写出了解的对应的算法。在共性上两类检测算法有哪些差异？

参考答案：
One-stage：yolov1、yolov2、yolov3、SSD、RetinaNet（2分）

Two-stage：Fast R-CNN、Faster R-CNN（2分）

Two-stage检测算法的共性，以faster r-cnn为例，使用了复杂的网络用于每个候选区域的分类和回归；ROI pooling后的feature channels数目较大，导致内存消耗和计算量都比较大。

One-stage检测算法的共性，从网络结构上看只是多分类的rpn网络，相当于faster rcnn的第一阶段，因此one-stage主要的优势是速度快。其预测结果是从feature map回归出目标的位置及分类，有的也采用了anchor的概念。而two-stage对上述结果进行roi pooling后会进一步细化，因此two-stage算法检测精度一般相对较高。还有一种观点是，two-stage的rpn部分相当于做了正负样本均衡，这也是two-stage检测效果相对较好的一个原因。one-stage算法对小目标检测效果较差，如果所有的anchor都没有覆盖到这个目标，那么这个目标就会漏检。如果一个比较大的anchor覆盖了这个目标，那么较大的感受野会弱化目标的真实特征，得分也不会高。two-stage算法中的roi pooling会对目标做resize, 小目标的特征被放大，其特征轮廓也更为清晰，因此检测也更为准确。

参考自：图像处理