
算法学习
文章平均质量分 75
小哥哥th
机器学习\计算机视觉
展开
-
OpenCV中光流法跟踪器的使用方法学习
一、基于特征点的目标跟踪的一般步骤 (1)探测当前帧的特征点 (2)通过当前帧和下一帧的灰度比较,估计当前帧特征点在下一帧的位置 (3)过滤位置不变的特征点,余下的点就是目标了 基于特征点的目标跟踪算法和1,2两个步骤有关,特征点可以是Harris角点,也可以是边缘点等等,第二步估计特征点的位置也有很多方法,比如光流法,卡尔曼滤波法。下面介绍是改进的Hariis角点来提取特征点,用Luc原创 2017-11-19 10:25:24 · 6532 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(10)
第十天1、在以下不同的场景中,使用的分析方法不正确的有A根据商家最近一年的经营及服务数据,用聚类算法判断出天猫商家在各自主营类目下所属的商家层级B根据商家近几年的成交数据,用聚类算法拟合出用户未来一个月可能的消费金额公式C用关联规则算法分析出购买了汽车坐垫的买家,是否适合推荐汽车脚垫D根据用户最近购买的商品信息,用决策树算法识别出淘宝买家可能是男还是女正确答案是: B预测消费...原创 2018-11-03 20:05:03 · 3463 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(11)
第十一天1、关于 ARMA 、 AR 、 MA 模型的功率谱,下列说法正确的是( )AMA模型是同一个全通滤波器产生的BMA模型在极点接近单位圆时,MA谱是一个深谷CAR模型在零点接近单位圆时,AR谱是一个尖峰DRMA谱既有尖峰又有深谷正确答案是:DMA模型滑动平均模型,模型参量法谱分析方法之一,也是现代谱估中常用的模型。用MA模型法求信号谱估计的具体作法是:①选择MA模型...原创 2018-11-04 09:42:42 · 2048 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(12)
第十二天1、假定你用一个线性SVM分类器求解二类分类问题,如下图所示,这些用红色圆圈起来的点表示支持向量如果移除这些圈起来的数据,决策边界(即分离超平面)是否会发生改变?AYesBNo正确答案是: B从数据的分布来看,移除那三个数据,决策边界不会受影响。2、如果将数据中除圈起来的三个点以外的其他数据全部移除,那么决策边界是否会改变?A会B不会正确答案是: B决策边...原创 2018-11-04 09:43:10 · 1905 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(13)
第十三天1、假定你使用SVM学习数据X,数据X里面有些点存在错误。现在如果你使用一个二次核函数,多项式阶数为2,使用松弛变量C作为超参之一。当你使用较大的C(C趋于无穷),则:A仍然能正确分类数据B不能正确分类C不确定D以上均不正确正确答案是:A采用更大的C,误分类点的惩罚就更大,因此决策边界将尽可能完美地分类数据。2、假定你使用SVM学习数据X,数据X里面有些点存在错误...原创 2018-11-04 09:43:40 · 1466 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(14)
第十四天1、判断:没有必要有一个用于应用维数降低算法的目标变量。A真B假正确答案是:A2、在数据集中有4个变量,如A,B,C和D.执行了以下操作:步骤1:使用上述变量创建另外两个变量,即E = A + 3 * B和F = B + 5 * C + D。步骤2:然后只使用变量E和F建立了一个随机森林模型。上述步骤可以表示降维方法吗?A真B假正确答案是:A因为步骤1可以用...原创 2018-11-04 09:44:05 · 1230 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(15)
第15天1、想像正在处理文本数据,使用单词嵌入(Word2vec)表示使用的单词。在单词嵌入中,最终会有1000维。现在想减小这个高维数据的维度,这样相似的词应该在最邻近的空间中具有相似的含义。在这种情况下,您最有可能选择以下哪种算法?At-SNEBPCACLDAD都不是正确答案是:A-SNE代表t分布随机相邻嵌入,它考虑最近的邻居来减少数据。2、判断:t-SNE学习非参数...原创 2018-11-04 09:44:37 · 1373 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(16)
第16天1、PCA和LDA的以下比较哪些是正确的?LDA和PCA都是线性变换技术LDA是有监督的,而PCA是无监督的PCA最大化数据的方差,而LDA最大化不同类之间的分离A1和2B1和3C只有3D1、2和3正确答案是:D2、PCA是一种很好的技术,因为它很容易理解并通常用于数据降维。获得特征值λ1≥λ2≥•••≥λN并画图。看看f(M)(贡献率)如何随着M而增加,...原创 2018-11-04 09:45:05 · 753 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(17)
第17天1、下面是三个散点图(A,B,C,从左到右)和和手绘的逻辑回归决策边界。正则化项惩罚度最高的是?AABBCCD都具有相同的正则化正确答案是:A因为正则化意味着更多的罚值和图A所示的较简单的决策界限。2、下图显示了三个逻辑回归模型的AUC-ROC曲线。不同的颜色表示不同超参数值的曲线。以下哪个AUC-ROC会给出最佳结果?A黄色B粉红色C黑色D...原创 2018-11-04 09:45:34 · 1241 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(18)
第18天1、分析逻辑回归表现的一个良好的方法是AIC,它与线性回归中的R平方相似。有关AIC,以下哪项是正确的?A具有最小AIC值的模型更好B具有最大AIC值的模型更好C视情况而定D以上都不是正确答案是:AAIC信息准则即Akaike information criterion,是衡量统计模型拟合优良性的一种标准,由于它为日本统计学家赤池弘次创立和发展的,因此又称赤池信息量准...原创 2018-11-04 09:46:02 · 1184 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(9)
第九天1、对于下面三个模型的训练情况, 下面说法正确的是:第一张图的训练错误与其余两张图相比,是最大的最后一张图的训练效果最好,因为训练错误最小第二张图比第一和第三张图鲁棒性更强,是三个里面表现最好的模型第三张图相对前两张图过拟合了三个图表现一样,因为我们还没有测试数据集A 1 和 3B 1 和 3C 1, 3 和 4D 5正确答案是:C最后一张过拟合, 训练错误最小...原创 2018-11-03 20:04:38 · 1377 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(8)
第八天1、对于下图, 最好的主成分选择是多少 ?A7B30C35DCan’t Say正确答案是: B主成分选择使variance越大越好, 在这个前提下, 主成分越少越好。2、数据科学家可能会同时使用多个算法(模型)进行预测, 并且最后把这些算法的结果集成起来进行最后的预测(集成学习),以下对集成学习说法正确的是A单个模型之间有高相关性B单个模型之间有低相关性C...原创 2018-11-03 20:04:16 · 2202 阅读 · 0 评论 -
【机器学习】一文读懂机器学习常用损失函数
损失函数(loss function)是用来估量模型的预测值f(x)与真实值Y的不一致程度,它是一个非负实值函数,通常使用L(Y, f(x))来表示,损失函数越小,模型的鲁棒性就越好。损失函数是经验风险函数的核心部分,也是结构风险函数重要组成部分。模型的结构风险函数包括了经验风险项和正则项,通常可以表示成如下式子: 其中,前面的均值函数表示的是经验风险函数,L代表的是损失函数,后面的Φ是...转载 2018-09-18 09:58:49 · 1042 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题
第一天1、以下哪种方法属于判别式模型(discriminative model)( )A 隐马模型(HMM)B 朴素贝叶斯C LDAD 支持向量机正确答案是:D已知输入变量x,判别模型(discriminative model)通过求解条件概率分布P(y|x)或者直接计算y的值来预测y。生成模型(generative model)通过对观测值和标注数据计算联合概率分布P(x,y)来达...原创 2018-11-03 20:00:34 · 4100 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(2)
第二天1、一个二进制源X发出符号集为{-1,1},经过离散无记忆信道传输,由于信道中噪音的存在,接收端Y收到符号集为{-1,1,0}。已知P(x=-1)=1/4,P(x=1)=3/4,P(y=-1|x=-1)=4/5,P(y=0|x=-1)=1/5,P(y=1|x=1)=3/4,P(y=0|x=1)=1/4,求条件熵H(Y|X)( )A0.2375B0.3275C0.5273D0...原创 2018-11-03 20:01:32 · 2738 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(3)
第三天1、以下不属于影响聚类算法结果的主要因素有()A已知类别的样本质量B分类准则C特征选取D模式相似性测度正确答案是:A都已知了,就不必再进行聚类了。2、模式识别中,不属于马式距离较之于欧式距离的优点的是( )A平移不变性B尺度不变性C考虑了模式的分布正确答案是:A欧氏距离定义:欧氏距离( Euclidean distance)是一个通常采用的距离定义,它...原创 2018-11-03 20:02:01 · 6856 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(4)
第四天:1、下列时间序列模型中,哪一个模型可以较好地拟合波动性的分析和预测。A AR模型B MA模型C ARMA模型D GARCH模型解析:AR auto regressive model AR模型是一种线性预测MA模型(moving average model)滑动平均模型,其中使用趋势移动平均法建立直线趋势的预测模型。ARMA模型(auto regressive moving ...原创 2018-11-03 20:02:30 · 2324 阅读 · 1 评论 -
一个月刷完机器学习笔试题300题(5)
第五天1、下列方法中,不可以用于特征降维的方法包括A 主成分分析PCAB 线性判别分析LDAC 深度学习SparseAutoEncoderD 矩阵奇异值分解SVD正确答案是:C特征降维方法主要有:PCA,LLE,IsomapSVD和PCA类似,也可以看成一种降维方法LDA:线性判别分析,可用于降维AutoEncoder:AutoEncoder的结构与神经网络的隐含层相同,由输...原创 2018-11-03 20:02:59 · 2651 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(6)
第六天61、bootstrap数据是什么意思?(提示:考“bootstrap”和“boosting”区别)A 有放回地从总共M个特征中抽样m个特征B 无放回地从总共M个特征中抽样m个特征C 有放回地从总共N个样本中抽样n个样本D 无放回地从总共N个样本中抽样n个样本正确答案是:Cbootstrap其实就是bagging的意思,是Bootstrap Aggregating的缩写,根据定...原创 2018-11-03 20:03:28 · 2998 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(7)
第七天1、使用k=1的knn算法, 下图二类分类问题, “+” 和 “o” 分别代表两个类, 那么, 用仅拿出一个测试样本的交叉验证方法, 交叉验证的错误率是多少:A0%B100%C0%到100D以上都不是正确答案是: Bknn算法就是, 在样本周围看k个样本, 其中大多数样本的分类是A类, 我们就把这个样本分成A类. 显然, k=1 的knn在上图不是一个好选择, 分类的...原创 2018-11-03 20:03:50 · 2351 阅读 · 0 评论 -
一个月刷完机器学习笔试题300题(19)
第19天1、下图显示了三个逻辑回归模型的AUC-ROC曲线。不同的颜色表示不同超参数值的曲线。以下哪个AUC-ROC会给出最佳结果?A黄色B粉红色C黑色D都相同正确答案是:A最佳分类是曲线下区域面积最大者,而黄线在曲线下面积最大2、假设你在测试逻辑回归分类器,设函数H为下图中的哪一个代表上述分类器给出的决策边界?A B C 正确答案是: B选项B正确。虽然我...原创 2018-11-04 09:46:33 · 1992 阅读 · 1 评论