慕课国家精品课,了解一下
本项目对中国大学Mooc的国家精品栏目进行了探索分析,共815门课程,涵盖12个字段,于3月29日由web scraper爬取获得,通过python进行数据清理,最后由tableau完成可视化及分析。
爬取结构如上图,数据清理部分详见github。本文将对分析及可视化就以下几个部分进行阐述(以下对中国大学Mooc国家精品课简称为mooc):
- 探索分析
- 通过各专业类课程数和参加人数分析其需求情况和用户特点
- 由精品到爆款的分析
- 状态为“已关闭该学期”,原因何在?
- 项目总结
1.简单的探索分析
清理后在tableau中打开,部分数据如下图:
先简单探索一番,熟悉数据。如下图为最近一期课程开课时间—数量对应图。
很明显,mooc的两个开课高峰点是三月和九月,分别对应春、秋两个开学季。这里春季的开课数量显著高于秋季是由于本次