Bugs in Large Language Models Generated Code: An Empirical Study

最新推荐文章于 2025-11-24 18:29:32 发布

UnknownBody

最新推荐文章于 2025-11-24 18:29:32 发布

阅读量164

点赞数

CC 4.0 BY-SA版权

分类专栏： LLM Daily LLM for code 文章标签：语言模型人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c_cpp_csharp/article/details/140275031

LLM Daily 同时被 2 个专栏收录

1689 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

58 篇文章

订阅专栏

本文是LLM系列文章，针对《Bugs in Large Language Models Generated Code:An Empirical Study》的翻译。

大型语言模型生成代码中的Bug：一项实证研究

摘要
1 引言
2 背景
3 实验设计
4 实证结果
5 经验学习
6 相关工作
7 对有效性的威胁
8 结论和未来工作

摘要

用于代码的大型语言模型（LLM）最近得到了极大的关注。他们可以根据提供的提示用不同的编程语言生成代码，实现软件工程（SE）中一个长期的梦想，即自动生成代码。与人工编写的代码类似，LLM生成的代码很容易出现错误，而且这些错误尚未得到社区的彻底检查。鉴于SE活动中越来越多地采用基于LLM的代码生成工具（例如GitHub Copilot），了解LLM生成的代码中包含的错误的特征至关重要。本文研究了从使用三种主要LLM（即CodeGen、PanGu Coder和Codex）生成的代码中收集的333个错误的样本，并确定了以下10种不同的错误模式：错误解释、语法错误、愚蠢错误、提示偏误代码、缺角情况、错误输入类型、幻觉对象、错误属性、不完整生成和非提示考虑。bug模式以分类法的形式呈现。通过对34名LLM从业者和研究人员的在线调查，验证了已识别的错误模式。受调查的参与者通常断言错误模式的重要性和普遍性。研究人员和从业者可以利用这些发现为LLM生成的代码开发有效的质量保证技术。这项研究揭示了LLM生成代码的独特特征。

1 引言

2 背景

3 实验设计

4 实证结果

5 经验学习

6 相关工作

7 对有效性的威胁

8 结论和未来工作

在本文中，我们对LLM生

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。