阿拉伯语抄袭检测系统与越南语资产定价的人工智能应用
阿拉伯语抄袭检测系统
在阿拉伯语文本抄袭检测方面,有一种新方法被提出用于直接提取抄袭百分比,无需借助其他精确匹配方法。该方法具有简单、执行速度快的特点。
方法评估
通过与基于内容的基准方法—— Winnowing 方法进行对比,证明了该方法的有效性。使用精确率、召回率、F - 度量和错误率进行评估,得出以下结论:
1. 速度与准确性 :与 Winnowing 算法相比,该方法在速度和准确性上表现更优。
2. 执行时间 :执行速度比 Winnowing 快四倍。
3. 评估指标 :精确率、召回率、F - 度量和错误率等指标均优于 Winnowing 方法。
4. 时间复杂度 :以往方法计算交集需要 2n 的时间复杂度,而该方法变为线性复杂度。
5. n - gram 大小影响 :增大 n - gram 的大小会增加内存使用,减少指纹数量,但会提高错误率和复杂度。
6. 文档比较 :可以在线性时间内将大量可疑文档与众多存储文档进行比较。
| 方法对比 | 新方法 | Winnowing 方法 |
|---|---|---|
| 速度 | 快四倍 |
超级会员免费看
订阅专栏 解锁全文
30

被折叠的 条评论
为什么被折叠?



