欢聚时代(YY)2018笔试总结(数据挖掘方向)

本文是作者对欢聚时代(YY)2018年数据挖掘笔试的总结,涵盖单选题、多选题和简单题,涉及关联规则、分类算法评价标准、回归树、K均值、数据预处理、SQL查询、HIVE数据倾斜优化、XGBoost和神经网络过拟合等知识点。笔试侧重基础,适合秋招复习。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

附上我自己的答案,题目顺序可能有误,我记不太清楚了=_=

一、单选题(24分)

1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A)
   A. 关联规则发现       B. 聚类
  C. 分类                      D. 自然语言处理

2.以下两种描述分别对应哪两种对分类算法的评价标准?(A)
  (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。
  (b)描述有多少比例的小偷给警察抓了的标准。
  A. Precision,Recall    B.Recall,Precision
  A. Precision,ROC      D. Recall,ROC

3.生成模型和判别模型的区分

判别模型:KNN、logistic回归、SVM、

生成模型:贝叶斯、HMM

4.回归树用到的方法 :CART

5.考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队1获胜。队0获胜的比赛中只有30%是在队1的主场,而队1取胜的比赛中75%是主场获胜。如果下一场比赛在队1的主场进行队1获胜的概率为 (D)
    A.0.75    B.0.35    C.0.4678    D.0.5738

(这是牛客上的一道概率题)

6.在基本K均值算法里,当邻近度函数采用( A )的时候,合适的质心是簇中各点的中位数。

A、曼哈顿距离                           B、平方欧几里德距离

C、余弦距离                              D、Bregman散度</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值