论文阅读-自动程序修复-Automated Repair of Programs from Large Language Models

原创

已于 2024-03-27 00:53:57 修改 · 2k 阅读

·

30

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#语言模型 #人工智能 #自然语言处理 #自动生成的代码的修复

于 2024-02-06 22:56:12 首次发布

一文章主旨：

研究了Codex自动生成的程序中的错误，并探讨了现有的程序修复（APR）工具以及新发布的Codex-e是否能够修复由大型语言模型生成的有缺陷的程序（Codex-e作为APR工具的潜力）。

现在基于大语言模型，输入自然语言，生成代码的应用非常普遍。但是生成的代码正确率很低，因为这些模型缺乏对任务描述和程序语义的深入理解。文章以GPT-3模型的后代-Codex模型，为例，试图利用自动化程序修复（APR）技术来修复Codex产生的代码错误。

自动化修复技术接受一个有缺陷的程序和一个正确性规范，通过稍稍修改程序使其满足给定的规范来生成一个固定的程序。典型的修复工具通过推理程序语义与给定的规范来生成补丁。例如，基于语义的修复工具（如SemFix、Angelix）通过使用符号执行和基于搜索的修复工具（如Gen-Prog、TBar）在预定义的补丁中搜索正确的补丁。

二本文贡献：

（1）自动生成的代码与人工编写的解决方案存在相同的编程错误，表明自动化程序修复技术有潜力修复自动生成的代码。

（2）发现新发布的Codex编辑模式在修复错误解决方案方面与现有的Java修复工具TBar和Recoder相似或更好。

（3）作者提出了几点建议：包括增强自动化程序修复工具的修补空间、将重点从添加更多修复模式转向综合/语义为基础的方法，研究将语言模型与自动化程序修复相结合的可能性。

本文实验方向：

作者使用公共测试用例来指导修复，并使用私有测试用例来验证修复结果。

本文探讨了两个方向来修复语言模型生成的代码的错误

1.现有的APR技术（TBar和Recoder）

2.研究探讨了使用Codex-e作为自动化程序修复工具的可能性。

「利用OpenAI最近发布的Codex编辑模式（这个新功能可以使现有的

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄4年

121
原创

555
点赞

574
收藏

465
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 中国矿业大学密码学笔记

下一篇：: 论文阅读-Large Language Models are Zero-Shot Fuzzers: Fuzzing Deep-Learning Libraries via Large Language

最新评论

论文阅读-Large Language Models are Zero-Shot Fuzzers: Fuzzing Deep-Learning Libraries via Large Language
涤旧而生新: 兄弟太强了，最近也在研究这方面的东西！
使用pycharm+opencv进行视频抽帧(可以用来扩充数据集）+ labelimg的使用（数据标准）
苏几下: 最后是这个：COMET INFO : To upload this offline experiment , run : comet upload D :\yolov5-7.0\. cometml - runs \d9031c2bc8b846f986e5fe1124690158.zip
使用pycharm+opencv进行视频抽帧(可以用来扩充数据集）+ labelimg的使用（数据标准）
苏几下: train : weights =yolov5s. pt , cfg =, data = data \ bvn . yaml , hyp = data \ hyps \ hyp . scratch - low . yaml , epochs =100, batch _ size =16, imgsz =640, rect = False , resume = False , nosave = False , noval = False , noautoanchor = False , noplots = False , evolve = None , bucket =, cache = None , image _ weights = False , device =, multi _ scale = False , single _ cls = False , optimizer = SGD , sync _ bn = False , workers =8, pro ject = runs \ train , name = exp , exist _ ok = False , quad = False , cos _ lr = False , label _ smoothing =0.0, patience =100, freeze =[0], save _ period =-1, seed =0, local _ rank =-1, entity = None , upload _ datas et = False , bbox _ interval =-1, artifact _ alias = latest github : skipping check ( not a git repository ), for updates see https://github.com/ultralytics/yolov5 YOLOv52022-11-22 Python -3.12.7 torch -2.4.1+cu124 CUDA :0( NVIDIA GeForce RTX 4060 Laptop GPU ,8188MiB) hyperparameters :1r0=0.01,1rf=0.01, momentum =0.937, weight _ decay =0.0005, warmup _ epochs =3.0, warmup _ momentum =0.8, warmup _ bias _ lr =0.1, box =0.05, cls =0.5, cls _ pw =1.0, obj =1.0, obj _ pw =1.0, iou _ t =0.2, anchor _ t =4.0, fl _ gamma =0.0, hsv _ h =0.015, hsv _ s =0.7, hsv _ v =0.4, degrees =0.0, translate =0.1, scale =0.5, shear =0.0, perspective =0.0, flipud =0.0, fliplr =0.5, mosaic =1.0, mixup =0.0, copy _ paste =0.0ClearML: run ' pip install clearml ' to automatically track , visualize and remotely train YOLOv5 in ClearML TensorBoard : Start with ' tensorboard -- logdir runs \ train ', view at http://localhost:6006/ COMET WARNING : Comet credentials have not been set . Comet will default to offline logging . Please set your credentials to enable online logging . COMET WARNING : To get all data logged automatically , import comet _ ml before the following modules : tensorboard , tensorflow , keras , torch . COMET INFO : Using ' D :\yolov5-7.0\\. cometml - runs ' path as offline directory . Pass ' offline directory ' parameter into constructor or set the ' COMET _ OFFLINE DIRECTORY ' environment va riable to manually choose where to store offline experiment archives . COMET WARNING : Native output logging mode is not available , falling back to basic output logging Traceback ( most recent call last ): File " d :yolov5-7.0\ train . py ", line 633, in < module > main ( opt ) File " d :\yolov5-7.0\ train . py ", line 527, in main train ( opt . hyp , opt , device , callbacks ) File " d :\yolov5-7.0\ train . py ", line 95, in train loggers = Loggers ( save _ dir , weights , opt , hyp , LOGGER )# loggers instance ΑΛΑΑΑΑΛΛΛΑΛΑΛΑΑΛΑΑΛΑΑΑΑΛΑΛΛΑΑΛΛΑΑΛΑΛΛΛΑΑΛΛΛΑ File " d :\yolov5-7.0\ utils \ loggers _ init _- py ", line 132, in _ init _ self . comet _ logger = CometLogger ( self . opt , self . hyp ) ΑΛΑΑΛΑΛΛΑΛΛΛΑΛΛΛΛΛΑΑΛΛΑΛΛΛΛΛΛΛΑ File " d :\yolov5-7.0\ utils \ loggers \ comet _ init _. py ", line 97, in _ init __ self . data _ dict = self . check _ dataset ( self . opt . data ) Aww File " d :\yolov5-7.0\ utils \ loggers \ comet __ init _. py ", line 232, in check _ dataset data _ config = yaml . safe _ load ( f ) AAww File " C :\ Users \ Lenono \. conda \ envs \yolov5\ Lib \ site - packages yaml _ init _. py ", line 125, in safe _ load return load ( stream , SafeLoader ) ΑΛΛΛΛΛΑΛΛΛΑΛΛΛΛΛΑΑΛΛΑΛΛΑ File " C :\ Users \ Lenono \. conda \ envs \yolov5\ Lib \ site - packages \ yaml __ init _. py ", line 79, in load loader = Loader ( stream ) AAAAAAAAAAAAA File " C :\ Users \ Lenono \. conda \ envs \yolov5\ Lib \ site - packages \ yaml \ loader . py ", line 34, in _ init _ Reader ._ init _( self , stream ) File " C :\ Users \ Lenono \. conda \ envs \yolov5\ Lib \ site - packages yaml \ reader . py ", line 85, in _ init _ self . determine _ encoding () File " C :\ Users \ Lenono \. conda \ envs \yolov5\ Lib \ site - packages \ yaml \ reader . py ", line 124, in determine _ encoding data = self . stream . read ( size ) ΑΛΑΑΑΑΑΑΑΑΑΑΛΛΛΑΛΛΛΛΛΑ UnicodeDecodeError :' gbk ' codec can ' t decode byte 0x80 in position 233: illegal multibyte sequence COMET INFO : The process of logging environment details ( conda environment , git patch ) is underway . Please be patient as this may take some time . COMET INFO : Couldn '
使用pycharm+opencv进行视频抽帧(可以用来扩充数据集）+ labelimg的使用（数据标准）
苏几下: 我又弄了一次，然后有照片了，但是运行train.py的时候一直不行
使用pycharm+opencv进行视频抽帧(可以用来扩充数据集）+ labelimg的使用（数据标准）
Che_Che_: 你可以试试文中提到的，自己手动创建一个images文件夹，再运行一次，看看文件夹里面有没有

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。