教育与机构分析框架:概念、应用与实践
1. 关键概念
数据是信息的最小单位,可由用户明确提供(如名字),也可从用户与信息系统的交互中推导得出(如登录尝试次数)。信息则是从数据中推断而来,可能是绝对的(如课程最终成绩),也可能是有条件的(如课程成功完成的概率)。可用数据的类型和期望的结果将决定数据所经历的处理和分析类型。例如,单门课程成绩的总结可能使用统计技术,而基于学生先前选择的课程推荐则可能使用机器学习技术。
数据的分析通常是为了应对学术、行政或技术问题,可按目的(如帮助学生实现学习目标、跟踪机构财务目标等)进行组织,也可按方法(如自动知识发现、数据可视化等)进行分类。分析可以采取假设检验的形式,即事先提出假设,结果支持或反驳该假设;也可以作为概括和解释任务,在分析完成后审查算法的输出。
从数据构建知识的两种主要方法是分析学和数据挖掘,在学术背景下则分别成为教育数据挖掘(EDM)和学习分析(LA)。国际教育数据挖掘协会将EDM定义为:“一门新兴学科,致力于开发探索来自教育环境的独特数据类型的方法,并利用这些方法更好地理解学生及其学习环境”。学习分析研究协会将LA定义为:“对学习者及其环境的数据进行测量、收集、分析和报告,以理解和优化学习及其发生的环境”。更广泛的定义将分析学定义为“使用数据、统计分析以及解释性和预测性模型来获取见解并应对复杂问题”。
分析学和数据挖掘都依赖计算机科学来提供处理数据所需的理论基础和实用方法。LA和EDM之间的界限并不清晰,因为在这两种方法中,处理、计算和报告功能都起着关键作用。在许多文献和大众媒体中,分析学、挖掘、机器学习和人工智能等术语常被互换使用,这可能会导致混淆。一些人认为EDM是LA的一部分,负责分析的计算方面,学习分析