81、规避不同抄袭检测算法的临时成本分析

规避不同抄袭检测算法的临时成本分析

1. 研究背景与目的

在此次研究中,旨在探究一个此前未被深入研究的因素:作者为修改文本以避免抄袭检测工具识别所花费的时间,会对抄袭检测产生怎样的影响。为此,使用了专门开发的工具对多种抄袭检测算法进行测试,这些算法此前已被证明在抄袭检测任务中有效。

2. 检测工具与算法比较
  • 工具功能 :该专门开发的工具能够对文本应用多种抄袭检测算法,包括字面字符串检测、Levenshtein算法、Carp Rabin算法和Jaro - Winkler算法。其优势在于具备完整的算法配置系统,可指定不同的因素或限制条件,且能处理本地和远程文件。
  • 算法测试 :此前的研究中,工具所实现的大部分算法已针对两种类型的文本(原始文本和抄袭文本)进行了测试。这些文本均在测试环境中创建,确保了测试元素的质量。通过测试,识别出了在抄袭检测中表现较好的算法,尤其关注能减少误报数量的算法。
  • 算法配置 :算法被配置为分析连续单词的数量以及这些单词组中与原始文本相同的单词数量。工具会将满足一定相似度条件的单词组标记为抄袭,最终根据文本总单词数和被识别为抄袭的单词组数量,得出整个文本的抄袭百分比。
  • 参数影响 :工具中可修改每组单词数量(X)和相似单词数量(Y),这两个参数直接影响抄袭检测的灵敏度。例如,当配置为在一组X个单词中找到Y = X/2个与原始文本相同的单词时,该组单词将被视为抄袭。根据不同的X和Y值,抄袭百分比会有显著变化。一般来说,抄袭百分比
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值