机器学习笔试面试题——day2

选择题

1、以下不属于影响聚类算法结果的主要因素有()
A 已知类别的样本质量
B 分类准则
C 特征选取
D 模式相似性测度

聚类不知道类别


2、模式识别中,不属于马式距离较之于欧式距离的优点的是( )
A 平移不变性
B 尺度不变性
C 考虑了模式的分布

缺点
1)马氏距离的计算是建立在总体样本的基础上的,即同样的样本在不同的总体中距离是不一样的
2)要求协方差逆矩阵必须存在(总体样本数大于样本维度且样本不共线),否则用欧式距离;由于协方差矩阵的存在,导致马氏距离不稳定
3)它夸大了变化微小的变量的作用
优点
1)尺度不变性,不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关;
2)由标准化数据和中心化数据(即原始数据与均值之差)计算出的二点之间的马氏距离相同。
3)考虑了变量的相关性
马氏和欧式距离都具有:平移不变性和旋转不变性


两个向量x1={x_11,x_12,...,x_1n}, x2={x_21,x_22,...,x_2m} 欧式距离:\sqrt{\sum (x_1k - x_2k)^2 }

标准差\sigma _x = \sqrt{\frac{\sum (x_i - \mu)^2}{n-1}} = \sqrt{s}方差;协方差cov(x,y) = \frac{\sum (x_i - \mu _x)(y_i - \mu_y) }{n-1}

3、影响基本K-均值算法的主要因素有()
A 样本输入顺序
B 模式相似性测度
C 聚类准则

4、在统计模式分类问题中,当先验概率未知时,可以使用()
A 最小损失准则
B 最小最大损失准则
C 最小误判概率准则

先验概率未知时,采用最小最大误判准则,N-P准则


5、如果以特征向量的相关系数作为模式相似性测度,则影响聚类算法结果的主要因素有( )
A 已知类别样本质量
B 分类准则
C 量纲

以特征向量的相关系数作为模式相似性度量
那么分类准则和特征选取会影响聚类算法

6、以下属于欧式距离特性的有()
A 旋转不变性
B 尺度缩放不变性
C 不受量纲影响的特性

7、以下( )不属于线性分类器最佳准则?
A 感知准则函数
B 贝叶斯分类
C 支持向量机
D Fisher准则

线性分类器三大准则:
感知器准则函数:使错分类样本到分类界面距离之和最小,通过错分类样本信息对分类器函数修正
SVM:分类界面使两类间隔最大,期望泛化风险最小
Fisher准则:LDA线性判别分析,样本投影到一条直线上,类内距离小,类间距离大,最大化广义瑞利熵


8、一监狱人脸识别准入系统用来识别待进入人员的身份,此系统一共包括识别4种不同的人员:狱警,小偷,送餐员,其他。下面哪种学习方法最适合此种应用需求:
A 二分类问题
B 多分类问题
C 层次聚类问题
D k-中心点聚类问题
E 回归问题
F 结构分析问题

9、关于 logit 回归和 SVM 不正确的是()
A Logit回归目标函数是最小化后验概率
B Logit回归可以用于预测事件发生概率的大小
C SVM目标是结构风险最小化
D SVM可以有效避免模型过拟合

10、有两个样本点,第一个点为正样本,它的特征向量是(0,-1);第二个点为负样本,它的特征向量是(2,3),从这两个样本点组成的训练集构建一个线性SVM分类器的分类面方程是( )
A 2x&#

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值