数据挖掘试卷2024

刚刚考完啦,一共七道大题

---

1、航空公司,跟踪不同航线上旅客的季节变化情况和增长,并跟踪在不同航班上所消费的食品和饮料情况。

   1)面向这次任务,设计数据仓库模型

   2)统计北美航线的年度水果饮料的销量,OLAP操作

2、处理数据 100 400 500 1000 1100 2000

  1)Max-min 标准化,new_max=1,new_min=0,处理全部数据

  2)z-score标准化100(均值=850 标准差为667)

  3)边缘平滑,深度为3

3、1)  计算信息增益,root level划分属性?

      2)Z:short red blue,朴素贝叶斯分类

idheighhaireyeClass
1HighABlondC1
2HighABlondC1
3HighABlueC1
4shortBBlondC1
5HighBBlondC1
6HighRedBlueC2
7shortBBlueC2
8shortBBlueC2

4、min_sup=60%,FP树,条件FP树,写出所有的频繁项集

iditem
1X,V,Y
2X,V,Y,W,Z
3W,Z,X
4V,X,Y

5、Single Link聚类,写清层次

ID属性1属性2
111
212
321
422
534
635
744
845

6、1)求与student1最相似的TOP 2学生,用cos sim

     2)预测student1,item2的值,利用top 2学生数据

studentitem1item2item3item4
1312
23214
33315
42134

7、某公司数据库里有一堆数据,作者、论文、出版社、论文标题、出版数量(假设无引用信息)等信息形成 heterogous information network,求预测topics(一系列)that an author work in the coming future?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值