基于TGKT - RL的个性化学习路径推荐与高阶信息融合的社区检测方法
在当今的教育和网络分析领域,个性化学习路径推荐和社区检测都是非常重要的研究方向。下面将详细介绍基于TGKT - RL的个性化学习路径推荐模型以及融合高阶信息的非负矩阵分解社区检测方法。
基于TGKT - RL的个性化学习路径推荐
学习路径推荐网络(LPRN)
LPRN是一个强化学习网络。实际训练时,首先要基于历史数据训练知识追踪网络(KTN)。KTN作为强化学习环境,在每个时间步提供知识状态,并参与LPRN的训练,以训练一个代理来推荐个性化练习。
我们将推荐过程建模为部分可观测马尔可夫决策过程(POMDP),其中状态是从KTN获得的学习者潜在知识状态,动作是推荐一个练习。训练前,预先设定目标知识状态 $h_{goal} = {p_{k1}, p_{k2}, \ldots, p_{kn} | p_{ki} \in [0, 1]}$,表示学习者希望达到的每个知识技能 $k_i$ 的掌握程度。
每个时间步生成知识状态后,将其与 $h_{goal}$ 进行比较:
$C_t = h_{goal} - s_t = {d_{k1}, d_{k2}, \ldots, d_{kn}}$
其中 $d_{ki}$ 表示技能 $k_i$ 的当前知识状态与目标知识状态之间的差异。若 $|C_t - \epsilon| \to 0$,则强化学习网络训练完成,LPRN生成的练习序列就是推荐的个性化学习路径;否则,需要进一步训练LPRN。
同时,考虑所有历史知识状态 ${s_1, s_2, \ldots, s_t}$ 的全局变化稳定度 $F_t$ 来衡量知识
超级会员免费看
订阅专栏 解锁全文
38

被折叠的 条评论
为什么被折叠?



