选择题
1、以下不属于影响聚类算法结果的主要因素有()
A 已知类别的样本质量
B 分类准则
C 特征选取
D 模式相似性测度
聚类不知道类别
2、模式识别中,不属于马式距离较之于欧式距离的优点的是( )
A 平移不变性
B 尺度不变性
C 考虑了模式的分布
缺点
1)马氏距离的计算是建立在总体样本的基础上的,即同样的样本在不同的总体中距离是不一样的
2)要求协方差逆矩阵必须存在(总体样本数大于样本维度且样本不共线),否则用欧式距离;由于协方差矩阵的存在,导致马氏距离不稳定
3)它夸大了变化微小的变量的作用
优点
1)尺度不变性,不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关;
2)由标准化数据和中心化数据(即原始数据与均值之差)计算出的二点之间的马氏距离相同。
3)考虑了变量的相关性
马氏和欧式距离都具有:平移不变性和旋转不变性
标准差方差;协方差
3、影响基本K-均值算法的主要因素有()
A 样本输入顺序
B 模式相似性测度
C 聚类准则
4、在统计模式分类问题中,当先验概率未知时,可以使用()
A 最小损失准则
B 最小最大损失准则
C 最小误判概率准则
先验概率未知时,采用最小最大误判准则,N-P准则
5、如果以特征向量的相关系数作为模式相似性测度,则影响聚类算法结果的主要因素有( )
A 已知类别样本质量
B 分类准则
C 量纲
以特征向量的相关系数作为模式相似性度量
那么分类准则和特征选取会影响聚类算法
6、以下属于欧式距离特性的有()
A 旋转不变性
B 尺度缩放不变性
C 不受量纲影响的特性
7、以下( )不属于线性分类器最佳准则?
A 感知准则函数
B 贝叶斯分类
C 支持向量机
D Fisher准则
线性分类器三大准则:
感知器准则函数:使错分类样本到分类界面距离之和最小,通过错分类样本信息对分类器函数修正
SVM:分类界面使两类间隔最大,期望泛化风险最小
Fisher准则:LDA线性判别分析,样本投影到一条直线上,类内距离小,类间距离大,最大化广义瑞利熵
8、一监狱人脸识别准入系统用来识别待进入人员的身份,此系统一共包括识别4种不同的人员:狱警,小偷,送餐员,其他。下面哪种学习方法最适合此种应用需求:
A 二分类问题
B 多分类问题
C 层次聚类问题
D k-中心点聚类问题
E 回归问题
F 结构分析问题
9、关于 logit 回归和 SVM 不正确的是()
A Logit回归目标函数是最小化后验概率
B Logit回归可以用于预测事件发生概率的大小
C SVM目标是结构风险最小化
D SVM可以有效避免模型过拟合
10、有两个样本点,第一个点为正样本,它的特征向量是(0,-1);第二个点为负样本,它的特征向量是(2,3),从这两个样本点组成的训练集构建一个线性SVM分类器的分类面方程是( )
A 2x&#