DETECT:用于挖掘教育数据中行为趋势的分层聚类算法
1. DETECT算法概述
DETECT算法旨在对教育数据集中的学生行为进行聚类,从而揭示群体行为趋势。这些趋势可能包括随时间的行为变化、课程特定点的异常行为或其他可定制的趋势。该算法通过迭代地将学生行为划分为多个聚类,以最大化基于时间的目标函数。教师和课程设计者可以解读这些聚类,从而更好地理解学生在课程中的行为。
1.1 适用数据集
DETECT可应用于多种数据集,但要求数据具有时间属性,即能够划分为一系列可比较的时间步。例如,一系列家庭作业任务或干预期间的固定时间段都可视为可比较的时间步。此外,对于每个学生和每个时间段,都应有一组描述该时间段内学生行为的特征。这些特征可以是数值型(如练习尝试次数)或分类性(如作业风格标签)。需要注意的是,特征不要求相互独立或同等重要,因为目标函数可以评估特征质量并对不太有用的特征进行惩罚。
输入数据的结构如下表所示:
| Student | Time | F1 | F2 | … | FM |
| ---- | ---- | ---- | ---- | ---- | ---- |
| 1 | 1 | v111 | v112 | … | v11M |
| 1 | 2 | v121 | v122 | … | v12M |
| … | … | … | … | … | … |
| 1 | T | v1T1 | v1T2 | … | v1TM |
| … | … | … | … | … | … |
| S | 1 | vN11 | vN12 | … | vN1M |
| … | … |
超级会员免费看
订阅专栏 解锁全文
991

被折叠的 条评论
为什么被折叠?



