在线学习行为分析与电影知识图谱推荐算法
1 在线学习行为分析
1.1 评估指标
K-means 算法需要指定初始聚类数,因此最合适的聚类数成为聚类结果的评估指标。在研究中,使用聚类碎石图和轮廓系数来评估聚类结果。聚类碎石图的纵坐标是聚类数,横坐标是聚类间的平均距离。轮廓系数通过计算单个样本组内的不相似度平均值和组间不相似度的最小值,然后取平均值作为整个聚类结果的轮廓系数。
1.2 数据描述与来源
研究使用学校在线提供的背景日志行为数据,共包含 39 门课程,每门课程学习时长为一个月,总时间跨度为一年,有 816 万条行为数据。具体数据文件如下表所示:
| 文件名称 | 字段 | 解释 |
| — | — | — |
| enrollment_train.csv | enrollment_id | 注册编号 |
| | username | 学生 ID |
| | course_id | 课程编号 |
| true_trian.csv | 第一列 | 注册编号 |
| | 第二列 | 0: 持续学习;1: 无法完成课程 |
| date.csv | course_id | 注册编号 |
| | From | 课程开始时间 |
| | To | 课程结束时间 |
| log_train.csv | enrlooment_id | 注册编号 |
| | Time | 操作发生时间 |
| | Source | 操作资源的两种方式:服务器和浏览器 |
| | Event | 七种操作类型 |
| | Object | 阅读或浏览
超级会员免费看
订阅专栏 解锁全文

3033

被折叠的 条评论
为什么被折叠?



