基于网络使用挖掘提升学生成绩的研究
1. 影响学生学业成绩的因素确定
1.1 问题定义
学生在课程中会进行不同活动以获取和巩固课堂所学概念,课程结束时有期末考试。成绩超过固定阈值的学生通过模块,低于该阈值则不通过。研究旨在通过分析学生的学习行为,找出能为学生和教育者提供有益活动和资源的有趣关系,以促进和改善学习过程。
为开展研究,将学生分为两组:高绩效学生(有高通过率)和低绩效学生(有高失败或辍学率)。收集学生在网络学习系统上的学习信息,综合考虑学生在课程中投入的时间、活动数量和类型,确定影响学生通过或不通过模块的活动。具体考虑的活动类型包括测验(咨询、通过和失败的数量)、作业(提交或咨询的练习/任务数量)和论坛(发送和阅读的消息数量)。
1.2 多实例视角
学生可获取的资源并非强制,而是在期末考试前巩固概念的支持。因此,每个学生执行的活动数量不同,课程所含活动的数量和种类也有差异。
传统监督学习对所有模式使用相同结构和属性数量,会导致多数模式存在空值。而多实例学习(MIL)能完美适应每个学生和课程的具体信息,消除传统表示中出现的缺失值。MIL表示的关键在于模式和实例的概念,一个模式(称为包)可包含不同数量的实例,对应关系是一对多而非传统监督学习的一对一。在该问题中,每个模式或包代表注册课程的学生,每个学生被视为代表其学习工作的包,包由一个或多个实例组成,每个实例代表学生完成的不同类型工作。学生完成的不同类型活动数量决定了每个模式的实例数量。相关属性信息如下表所示:
| 信息类型 | 属性 | 描述 |
| ---- | ---- | ---- |
| 包信息 | User - Id | 学生标识符 |
超级会员免费看
订阅专栏 解锁全文
1130

被折叠的 条评论
为什么被折叠?



