“数据科学”课程群与
“数据科学导论”课程建设初探
覃雄派,陈跃国,李翠平,柴云鹏,徐君,文继荣,杜小勇
中国人民大学信息学院,北京 100872
摘要:为适应新时代数据科学和大数据人才培养的需求,中国人民大学信息学院近年来针对计算机课程体系进行改革,设计了以“问题求解”“系统平台”和“数据科学”为主线的三大课程群。在介绍这三大课程群设计理念的基础上,重点介绍“数据科学”课程群中的第一门课“数据科学导论”课程的目标和定位、内容安排、教学计划、考核方法以及实践环节设计。
关键词:人才培养;大数据;数据科学;课程体系
论文引用格式:
覃雄派, 陈跃国, 李翠平, 柴云鹏, 徐君, 文继荣, 杜小勇. “数据科学”课程群与“数据科学导论”课程建设初探. 大数据[J], 2018, 4(6):19-28
QIN X P, CHEN Y G, LI C P, CHAI Y P, XU J, WEN J R, DU X Y. Toward construction of “data science” course group and “introduction to data science” course. Big data research[J], 2018, 4(6): 19-28
1 引言
数据科学是以计算机科学(特别是数据库、数据挖掘、机器学习等)和统计学为基础,融合其他学科的一门新兴的交叉学科。它研究数据的各种类型、状态、属性及其变化规律,研究如何对数据进行分析,从而揭示自然界和人类行为等现象背后的规律。
2016年,北京大学、对外经济贸易大学及中南大学3所高校申请并且成功获得教育部批准,建立“数据科学与大数据技术”本科专业。2017年,又有32所高校获批建立该专业,中国人民大学为其中之一。2018年3月,教育部公布第三批获批建立“数据科学与大数据技术”专业的院校。至此,共有280多所高校获批建立该专业。
如何设计“数据科学与大数据技术”专业的课程体系、建设各门课程,成为各个高校的教学主管领导和任课老师关心的问题。本文介绍中国人民大学信息学院在计算机专业教育课程体系方面进行的改革,并重点介绍其中“数据科学导论”课程的建设情况。
2 课程建设思路
2.1 计算机专业教育课程体系
随着计算机及互联网的飞速发展,当今社会已进入大数据时代,数据及其应用已经渗透到社会和生活的方方面面 。2015年9月5日国务院发布 了《促进大数据发展行动纲要》,系统部署了大数据发展工作,这意味着大数据发展正式上升为国家战略。数据的处理与分析是推动生产力增长的关键要素,国家急需大量能构建系统、会分析数据、懂领域业务的复合型人才。
在新的需求背景下,中国人民大学信息学院(以下简称信息学院)把计算机专业课程划分为“问题求解”“系统平台”和“数据科学”3条主线、“数学和自然科学”“人文社科教育”两条辅线,如图1所示。
图1 计算机专业教育课程体系
“问题求解”类课程主要训练学生用计算机求解问题的思维方式、方法和实现手段(编程)。“系统平台”类课程主要介绍和训练支持问题求解的实际计算机软硬件系统的使用、设计与实现。“问题求解”和“系统平台”两条主线中的课程设置主要是为了使计算机专业的学生在两个方面打下扎实的基础。而“数据科学”类课程涉及大数据从获取、存储、管理、分析到领域应用等整个数据生命周期各个环节的内容,尤其是云计算、大数据、人工智能(基于大数据的智能)等新技术,将重点集中在这一主线中进行讲授和训练。“数学和自然科学”辅线课程将为计算机专业的学生打下扎实的数学和自然科学基础,“人文社科教育”类课程的主要目标是提高学生的人文素养,积累社会学科的基础知识和方法论,同时数据科学中的大数据和人工智能的课程也会与人文社会学科深度结合。
从纵向看,从大一到大四,4个年级的课程深度逐步加强。大一阶段,主要通过“问题求解”主线中的程序设计等课程,训练学生的计算机编程能力,培养计算思维。从大二开始,设置“系统平台”和“数据科学”类课程,系统地培养学生问题求解的方法和能力,训练学生如何抽象问题、建立模型、求解问题,并编程实现;通过系统平台方面的基础课让学生初步了解计算机软硬件系统