斯坦福大学打响 ChatGPT 反击战,阻止学生用 AI 写作业

随着ChatGPT在学生中广泛用于作业,斯坦福研究人员发布了DetectGPT,一种检测AI生成文本的工具,以应对学术诚信问题。该方法基于大型语言模型的特定文本倾向,可识别机器生成的内容,尽管存在局限性,但在检测机器文本方面表现出优越性。这一进展引发了关于AI在教育中作用的讨论,以及如何平衡其利弊。

71585a3323e6abf2e43e8c3efa6e5c40.gif

整理 | 朱珂欣   

出品 | 优快云(ID:优快云news)

自 OpenAI 于 2022 年 11 月发布 ChatGPT 以来, ChatGPT 可谓是风靡各个领域:修bug、写代码、写周报、绘画、写小说……不仅如此,ChatGPT 也没“放过”教育圈,可谓是学生用得不亦乐乎,老师们却“防不胜防”……

据调查显示,美国 89% 的大学生在用 ChatGPT 做作业。近日,针对学生们屡禁不止的行为,斯坦福研究人员推出了 DetectGPT,便于检测出 AI 生成文本。DetectGPT 是基于大型语言模型(large language models,LLM)生成文本的特定倾向,从而可以判断文本是否是 AI 生成的。

新闻刚爆出,就引发不少网友关注,甚至有人调侃道:“ChatGPT 反击战终于敲响了,这一次是要用算法打败算法吗?

85a1a24025a9fd40536fe6ce4f5c5353.png

ChatGPT 被学生们“玩坏”

其实,本次教育圈的猛烈回击,并非无中生有,主要原因是学生们要把 ChatGPT“玩坏了”!

去年 12 月,弗曼大学哲学助理教授 Darren Hick 给学生们布置了一篇 500 字的课后文章。明明是一个没有难度的作业, Darren Hick 却发现居然有学生用 ChatGPT 来完成。

在一些“蛛丝马迹”的追踪后,Darren Hick 发现 AI 生成的第一个迹象是:尽管文章的句法连贯,但它毫无意义。他还表示:“可能在 ChatGPT 之后的升级优化中,这些痕迹将更难发现。”强大的 AI 生成,让 Darren Hick 感到极度恐惧。

但是,这并非个案。

据《纽约时报》1 月中旬报道,北密歇根大学的哲学教授 Antony Aumann 在为自己任教的一门世界宗教课程评分时,读到了一篇没有错别字和语法错误的“最佳论文”,教授倍感意外。不料最后发现,是学生用 ChatGPT 完成的。

在该篇论文中, ChatGPT 通过简洁的段落、恰当的举例和严谨的论据,探讨了禁止罩袍带来的道德问题。不禁让人深思,ChatGPT 是否也能对其它的话题侃侃而谈?究竟会带来什么更大的“惊喜”呢?

为了避免事态发展的更加严重,今年 1 月美国纽约市教育部正式宣布:纽约市的学生和教师,无法再在教育部设备或互联网上访问 ChatGPT 。很多大学甚至将“使用AI”列入作弊手段,开始纷纷出招!

4d111e7bd13f0be069942d1fa72ca984.png

斯坦福团队推出 DetectGPT

斯坦福大学研究团队推出 DetectGPT 的新方法 ,旨在成为首批打击高等教育中 LLM 生成文本的工具之一。

1 月 26 日,相关研究论文以《 DetectGPT : Zero-Shot Machine-Generated Text Detection using Probability Curvature 》为题,在网站 arXiv 上发布。

a5e1d20401c14307deeb76a80de4a4a8.jpeg

(图片来源:arXiv 论文截图)

该方法的原理是:由 LLM 生成的文本通常在模型的对数概率函数的负曲率区域的特定区域徘徊。基于这个观察结果,研究团队定义了一个新的基于曲率的标准(称为 “zero-shot”),可以让 DetectGPT 用于判断文本是否是机器生成的,并且不需要训练人工智能或收集大型数据集来比较文本。

然而,该方法存在一定的局限性。例如,在现有的掩模填充模型不能很好地表示有意义的改写空间的情况下,则某些域的性能可能会降低,从而导致曲率估计的质量被降低;以及 DetectGPT 相比于其他检测方法需要更多的计算量等。

值得一提的是,研究团队表示,该方法在检测机器生成的文本方面优于其他零样本方法,未来在机器生成文本检查方面将很有前途。并且,他们将尝试将这一方法用于 LLM 生成的音频、视频和图像的检测工作中。

02bbda878235edff9cba0f8e150987a4.png

网友:“感觉这是 AI 大战要开始了?”

伴随着#斯坦福大学推出新算法严查 ChatGPT 代写论文#的消息被爆出,就引发了网友的讨论热潮:

  • “这回学生用AI写论文要犯难了”;

  • “那我模仿 ChatGPT 的风格写作,怎么算呢”;

  • “感觉这是 AI 大战要开始了”;

  • “别人是用魔法打败魔法,你是用算法打败算法”。

毋庸置疑的是,随着 AI 技术的进一步发展,对于机器生成的文本及其相关的检测工作想必将备受关注。但是,任何事物的发展都存在两面性。一方面,AI 生成的文本能提供一套框架,便于人们更好地掌握修订和编辑的诀窍。而另一方面,它存在连续性较差,没有清晰的逻辑的缺点,甚至还会提供潜在的“作弊”可能。

那么,对于学生群体而言,该如何 ChatGPT 助力于自身学业的完成呢?对此,你怎么看?可以在评论区留言或讨论。

参考链接:

  • https://arxiv.org/abs/2301.11305

  • https://ericmitchell.ai/detectgpt/

  • https://i.ifeng.com/c/8Myj7nsgbqR

85ef70af6028ea5ffc64a31eb61cda50.gif

《2022-2023 中国开发者大调查》重磅启动,欢迎扫描下方二维码,参与问卷调研,更有 iPad 等精美大礼等你拿!

948b2ce50d3efabe15fdaad7cc852d61.png


 

 

d92c87a144bdbed0a5640da4d021266d.gif


 

 
☞程序员干得越久,代码写得越少?Meta 高级工程师现身说法
☞Oracle 改写 Java SE 定价模式,网友吐槽:神操作,一人用 Java,全员要付钱!
☞微软裁员1万人,遣散费约54亿元,人均获赔54万!
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值