百度2019计算机视觉题目问答题

关于K-means聚类算法,请回答以下问题:

  1. K-means是有监督聚类还是无监督聚类?(2分)

  2. 写出将N个样本(X=(x1,…,xN))聚成K类的K-means聚类算法的优化目标函数。(6分)

  3. 请用伪代码写出聚类过程。(8分)

  4. 假设样本特征维度为D,请描述Kmeans算法时间复杂度。(4分)

参考答案:

  1. 无监督

  2. 对于样本 x i x_i xi,计算其分类: c i = argmin ⁡ ∥ x i − u j ∥ 2 c_{i}=\operatorname{argmin}\left\|x_{i}-u_{j}\right\|^{2} ci=argminxiuj2
    c i c_i ci表示类别, u j u_j uj表示质心
    那么优化目标函数可以表示为: ∑ i N ∥ x i − u i ∥ 2 \sum_{i}^{N}\left\|x_{i}-u_{i}\right\|^{2} iNxiui2
    N N N表示样本量, u i u_i ui表示 c i c_i ci的质心

  3. def Kmeans (输入数据,类簇的个数K):
        初始计算K个质心点
        repeat迭代
            计算数据中每个点到各个质心的距离,按照最短距离原则划分为同一个簇,最后得到K个类簇
            重新计算K个类簇的质心
        until所有样本的类簇不发生改变或达到最大迭代次数
    
  4. 假设数据量为N,数据维度为D,K为簇的个数,I为迭代次数,那么Kmeans算法的时间复杂度为 N*D*K*I


相机模型有哪些参数,写出三维空间点到图像坐标投影公式。镜头畸变系数有哪几种,对应畸变矫正的公式表达?

参考答案:

相机模型的内参数主要有:主点,焦距,畸变系数。(3分)

三维空间点到二维图像的投影公式:(10分)

镜头畸变:径向畸变和切向畸变。(2分)

[ x y w ] = [ f x 0 c x 0 f y c y 0 0 1 ] [ x Y z ] \left[\begin{array}{l}x \\ y \\ w\end{array}\right]=\left[\begin{array}{lll}f_{x} & 0 & c_{x} \\ 0 & f_{y} & c_{y} \\ 0 & 0 & 1\end{array}\right]\left[\begin{array}{l}x \\ Y \\ z\end{array}\right] xyw=fx000fy0cxcy1xYz

径向畸变矫正公式表达:(3分)

x corrected  = x ( 1 + k 1 r 2 + k 2 r 4 + k 3 r 6 ) x_{\text {corrected }}=x\left(1+k_{1} r^{2}+k_{2} r^{4}+k_{3} r^{6}\right) xcorrected =x(1+k1r2+k2r4+k3r6)
y corrected  = y ( 1 + k 1 r 2 + k 2 r 4 + k 3 r 6 ) y_{\text {corrected }}=y\left(1+k_{1} r^{2}+k_{2} r^{4}+k_{3} r^{6}\right) ycorrected =y(1+k1r2+k2r4+k3r6)

切向畸变矫正公式表达:(2分)

x corrected  = x + [ 2 p 1 x y + p 2 ( r 2 + 2 x 2 ) ] x_{\text {corrected }}=x+\left[2 p_{1} x y+p_{2}\left(r^{2}+2 x^{2}\right)\right] xcorrected =x+[2p1xy+p2(r2+2x2)]
y corrected  = y + [ p 1 ( r 2 + 2 y 2 ) + 2 p 2 x y ] y_{\text {corrected }}=y+\left[p_{1}\left(r^{2}+2 y^{2}\right)+2 p_{2} x y\right] ycorrected =y+[p1(r2+2y2)+2p2xy]


系统设计题(20分)

在自动驾驶领域,障碍物的空间位置是很重要的信息。在不具备雷达等有测距能力传感器的情况下,如何仅通过单目相机计算出地面上目标的距离?

参考答案:
主要有两种方式来生成IPM图像

方案一:假设地面是平的,采用直接计算单应矩阵H投影的方式。手动或自动选取图像和三维空间点对应的4组标记点,计算出原始图像到IPM变换图像的单应矩阵H。因此图像坐标系中地平面上的任一点,乘以H矩阵后都可以计算出真实三维空间下的坐标。

方案二:同样需要地面是平的假设,通过标定出相机的内参数和外参数,投影换算出图像地平面和三维空间的关系。能够给出公式推导加分。


目前通过卷积神经网络进行检测的方法主要分为one-stage和two-stage,分别写出了解的对应的算法。 在共性上两类检测算法有哪些差异?

参考答案:
One-stage:yolov1、yolov2、yolov3、SSD、RetinaNet(2分)

Two-stage:Fast R-CNN、Faster R-CNN(2分)

Two-stage检测算法的共性,以faster r-cnn为例,使用了复杂的网络用于每个候选区域的分类和回归;ROI pooling后的feature channels数目较大,导致内存消耗和计算量都比较大。

One-stage检测算法的共性,从网络结构上看只是多分类的rpn网络,相当于faster rcnn的第一阶段,因此one-stage主要的优势是速度快。其预测结果是从feature map回归出目标的位置及分类,有的也采用了anchor的概念。而two-stage对上述结果进行roi pooling后会进一步细化,因此two-stage算法检测精度一般相对较高。还有一种观点是,two-stage的rpn部分相当于做了正负样本均衡,这也是two-stage检测效果相对较好的一个原因。one-stage算法对小目标检测效果较差,如果所有的anchor都没有覆盖到这个目标,那么这个目标就会漏检。如果一个比较大的anchor覆盖了这个目标,那么较大的感受野会弱化目标的真实特征,得分也不会高。two-stage算法中的roi pooling会对目标做resize, 小目标的特征被放大,其特征轮廓也更为清晰,因此检测也更为准确。


参考自:图像处理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值