自动评分与工业物联网自主网络构建技术解析
1. 自动评分系统中的抄袭检测与同行评审模块
自动评分系统对于提升教育评估效率和准确性有着重要意义。其中,抄袭检测模块和同行评审模块是两个关键组成部分。
1.1 抄袭检测模块
抄袭检测模块运用了三种文本相似度指标,通过加权平均的方式得出最终的抄袭分数。
- 相似度指标
- 余弦相似度 :将每份作业转换为向量,计算这些向量的余弦积。向量转换借助拟合变换器和TF - IDF变换器函数实现。公式为:
[SIM_{C}(t_{a},t_{b})=\frac{\sum_{t\in t_{a}\cap t_{b}}tfidf(t,a) \times tfidf(t,b)}{\sqrt{\sum_{t\in t_{a}}tfidf(t,a)^{2}}\times\sqrt{\sum_{t\in t_{b}}tfidf(t,b)^{2}}}]
其中,(t_{a})和(t_{b})是被比较的两份作业的向量。TF - IDF反映了单词在作业集合或语料库中的重要性,其计算基于词频(TF)和逆文档频率(IDF)。
- 词频(TF) :指一个术语在作业中出现的次数,计算公式为:
[TF_{t,d}=\frac{f_{t,d}}{f_{max,t,d}}]
其中,(f_{t,d})表示术语(t)在文档(d)中出现的原始频率。
- 逆文档频率(IDF) :是衡量一个单词相对于单个文档或语料库中一组文档所提供信息量的统计指标,计算公式为:
自动评分与能源收集技术解析
超级会员免费看
订阅专栏 解锁全文
70

被折叠的 条评论
为什么被折叠?



