考试后我有回忆并记录一部分题目但没有及时发布,最近又到了考试的时候,不少同学来问我,我找到了当时的回忆的一部分试题,并且联系了我的同学补全了整个试卷的回忆,感谢宇轩在提供的回忆版素材。
哈工大2023秋大数据分析期末考试回忆版
简答题:
1.大数据分析的定义,说出大数据分析的三个层次;
2.大数据分析的流程,预处理部分包含哪几个流程;
3.Spark核心部件和应用库有哪些,并简要说明功能;
4.主成分分析和因子分析的联系和区别;
5.说明Hive与传统关系型数据库(如MySQL)的异同;
6.文本数据分析的内容,好像是问文本数据的特点,具体的记不清了。
计算题和综合分析题:
1.计算矩估计和极大似然估计