一.单选题(共78题)
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|
D | C | A | D | A | B | D | C | A | D |
11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
B | A | C | B | B | C | B | C | B | D |
21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 |
C | A | A | C | B | C | D | D | C | C |
31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 |
B | B | C | D | A | ABC | B | B | B | D |
41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 |
A | B | C | B | B | C | C | B | B | B |
51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 |
C | C | A | A | B | D | A | D | C | A |
61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 |
B | D | A | D | C | C | A | B | A | D |
71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | ||
B | A | A | C | D | C | B | A |
1.下面哪个不属于数据的属性类型
A.标称
B.序数
C.区间
D.相异
2.属于定量的属性类型是
A.标称
B.序数
C.区间
D.相异
3.一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是
A.一年级
B.二年级
C.三年级
D.四年级
4.假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为
A.0.821
B.1.224
C.1.458
D.0.716
5.考虑数据集{12 24 33 24 55 68 26},其四分位数极差是
A.31
B.24
C.55
D.3
6.某班数学期末考成绩分组数据如下,则数据的中位数区间是
A.60至69分
B.70至79分
C.80至89分
D.90至100分
7.回归分析中使用的距离是点到直线的垂直坐标距离,最小二乘准则是指( )。
8.回归分析的步骤为( )。
① 进行相关分析 ② 建立预测模型 ③ 确定变量 ④ 确定预测值 ⑤ 计算预测误差
A.①③④⑤②
B.③①⑤②④
C.③②①⑤④
D.③⑤①②④
9.下列变量之间的关系是函数关系的是( )。
A.已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4ac。
B.光照时间和果树亩产量
C.降雪量和交通事故发生率
D.每亩施用肥料量和粮食产量
10.对于回归分析,下列说法错误的是( )。
A.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定
B.线性相关系数可以是正的,也可以是负的
C.回归分析中,如果r2=1,说明x与y之间完全相关
D.样本相关系数r∈(-1,1)
11.某地区调查了2~9岁儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为y=8.25x+60.13,下列叙述正确的是( )。
A.该地区一个儿童的身高为142.63cm
B.该地区2~9岁的儿童每年的身高约增加8.25cm
C.该地区9岁儿童的平均身高是134.38cm
D.利用这个模型可以准确地预测该地区每个2~9岁儿童的身高
12.
A.y = 0.51x + 6.65
B.y = 6.65x + 0.51
C.y = 0.51x + 42.30
D.y = 42.30x + 0.51
13.下表是x和y之间的一组数据,则y关于x的回归方程必过( )。
A.点(2, 3)
B.点(1.5, 4)
C.点(2.5, 4)
D.点(2.5, 5)
14.反映由模型中解释变量所解释的那部分离差大小的是( )。
A.总离差平方和
B.回归平方和
C.残差平方和
D.可决系数
15.总离差平方和TSS、残差平方和RSS与回归平方和ESS三者的关系是( )。
A.TSS>RSS+ESS
B.TSS=RSS+ESS
C.TSS<RSS+ESS
D.TSS2=RSS2+ESS2
16.决定系数R2的取值范围是( )。
A.R2<=1
B.R2>=1
C.0<R2<1
D.-1<R2<1
17.回归分析中定义的( )。
A.解释变量和被解释变量都是随机变量
B.解释变量为非随机变量,被解释变量为随机变量
C.解释变量和被解释变量都为非随机变量
D.解释变量为随机变量,被解释变量为非随机变量
18.最大或然准则是按从模型中得到既得的n组样本观测值的什么最大的准则确定样本回归方程( )。
A.离差平方和
B.均值
C.概率
D.方差
19.下表为日本的汇率与汽车出口数量数据,其中X为平均汇率(日元/美元),Y为汽车出口数量(万辆),那么,X与Y的相关系数为( )。
A.0.0769
B.0.9321
C.0.9203
D.0.0679
20.已知某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下,则早稻收获量对春季降雨量和春季温度的二元线性回归方程为( )。
21.为研究某市家庭收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下,则回归直线方程为()。
22.下列几种数据挖掘功能中被广泛的用于购物篮分析的是( )
A.关联分析;
B.分类和预测;
C.聚类分析;
D.演变分析
23.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题( )
A.关联规则发现;
B.聚类;
C.分类;
D.自然语言处理;
24.设X={1,2,3}是频繁项集,则可由X产生多少个关联规则( )
A.4;
B.5;
C.6;
D.7
25.置信度(confidence)是衡量哪种兴趣度度量的指标( )
A.简洁性;
B.确定性;
C.实用性;
D.新颖性;
26.关联规则的支持度公式为()
A.support(A=>B)=P(