国外调研:使用 ChatGPT 在技术面试中作弊有多难?结果令人震惊

部署运行你感兴趣的模型镜像

AI 已经深刻改变了我们的工作方式。无论是自动化日常管理,还是辅助开发者编写代码,它都展现出强大能力。但它是否也在悄悄重塑技术面试的游戏规则?

国外知名面试平台 interviewing.io 最近发起了一项引人关注的实验,试图回答一个关键问题:用 ChatGPT 在技术面试中作弊,到底有多容易?

背景:ChatGPT 引发的担忧

从 Reddit 到 YouTube,再到 X,越来越多声音在质疑:ChatGPT 是否意味着技术面试、甚至整个软件工程岗位的终结?学生用它写作业、开发者用它答题,这是否会引发行业危机?

为验证这些担忧的真实性,interviewing.io 搭建了一场“模拟作弊”的真实测试。


实验设计:三种问题 + 三类面试

平台邀请了数十位经验丰富的工程师参与模拟面试,并明确要求他们​必须在面试中使用 ChatGPT 答题​,不能依靠自身经验。

面试官共分为三组,分别使用以下三类问题:

  1. 逐字 LeetCode 题目​:直接照搬 LeetCode 原题。
  2. 修改后 LeetCode 题目​:题目结构类似,但关键点有变化。
  3. 完全自定义题目​:原创题,无法在网上搜索答案。

面试官不知情此次实验与 ChatGPT 有关,只被告知他们参与的是一道关于“问题类型与评估准确性”的研究。


样本说明

参与者需满足以下条件:

  • 拥有 4 年以上经验;
  • 正在申请高级岗位;
  • 熟悉 ChatGPT,并自信可以使用它完成面试。

共进行 37 场面试,最终保留 32 场有效样本(其余因未按要求使用 ChatGPT 被剔除)。


实验结果:作弊者表现竟然更好?

逐字 LeetCode 组:通过率 73%

受访者普遍轻松应对,ChatGPT 给出完整准确答案。多数面试官未察觉异常,甚至推荐部分候选人成为平台导师。

修改题组:通过率 67%

虽然题目做了轻微修改,但 ChatGPT 仍能解答大部分问题。虽然需要更多提示,但本质上并未增加作弊难度。

自定义题组:通过率仅 25%

只有原创题目明显压制了 ChatGPT 的辅助效果,且通过率甚至低于未使用 ChatGPT 的普通对照组。


更令人震惊的发现:0 名候选人被识破作弊

尽管面试后有多次机会反馈,​没有一位面试官怀疑到候选人作弊​。即使是那些表现奇怪、反应迟钝的面试者,最终也只被认为是“准备不充分”或“表达能力弱”。

在面试后问卷中:

  • 81% 候选人相信自己未被怀疑​;
  • 13% 觉得可能被看出端倪​;
  • 仅 6% 认为面试官识破了他们的作弊行为​。

这说明:在音频无摄像的远程面试中,使用 ChatGPT 作弊非常隐蔽且高效。

在此介绍一款辅助面试工具:登科及第 ,设备隔离、人性化回答比其他同类产品更安全。


结论:公司必须立刻改变面试题策略!

这项实验传递出一个明确信号:

只要公司继续照搬 LeetCode 原题,面试就极易被 ChatGPT 破解。

面试不应该考察谁背得多,而应该考察谁能解决真实问题。因此,建议企业立即:

  • 避免使用网上已有标准题;
  • 设计具备唯一输入输出结构的原创问题;
  • 提出与公司业务相关的真实场景题;
  • 考虑混合使用行为面试与白板问题,提高综合判断力。

甚至要注意:仅靠“换皮”改写题目(如加个故事背景),无法真正防止 ChatGPT 识别并解答问题。


写在最后:这场实验给行业的警示

这项实验本质上揭示了一个问题:

面试不该只靠记忆力,而应回归对候选人真实能力的评估。

面试作弊不该成为常态,ChatGPT 的出现应推动行业变革。我们需要更真实、更定制、更具挑战性的题目来挖掘人才,而不是一味沿用那些被 ChatGPT “记住”的标准模板题。

是时候重塑技术面试了。

您可能感兴趣的与本文相关的镜像

GPT-oss:20b

GPT-oss:20b

图文对话
Gpt-oss

GPT OSS 是OpenAI 推出的重量级开放模型,面向强推理、智能体任务以及多样化开发场景

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值