WAVECODER: WIDESPREAD AND VERSATILE ENHANCED INSTRUCTION TUNING WITH REFINED DATA GENERATION

828 篇文章

已下架不支持订阅

WaveCoder是通过CodeOcean数据集改进的LLM,它提升了指令微调的通用性和代码相关任务的泛化能力。CodeOcean包含4个任务的20K指令实例,用于增强模型性能。实验表明,WaveCoder在代码修复和摘要任务中表现优秀,且在代码生成基准上保持高效。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是LLM系列文章,针对《WAVECODER: WIDESPREAD AND VERSATILE ENHANCED INSTRUCTION TUNING WITH REFINED DATA GENERATION》的翻译。

WAVECODER:具有精细数据生成功能的广泛而通用的增强指令调整

摘要

最近的工作表明,在对高质量的指令数据集进行微调后,生成的模型可以获得令人印象深刻的能力来处理广泛的任务。然而,现有的指令数据生成方法往往会产生重复的数据,并且在数据质量上不够可控。在本文中,我们通过将指令数据分类到4个代码相关任务来扩展指令调优的通用性,这4个任务是专门为增强代码大型语言模型(LLM)的指令调优而设计的,并提出了一个基于LLM的生成器-鉴别器数据处理框架,以从开源代码中生成多样化、高质量的指令数据。因此,我们引入了CodeOcean,这是一个包含4个通用代码相关任务的20000个指令实例的数据集,旨在增强指令调优的有效性,提高微调模型的泛化能力。随后,我们介绍了WaveCoder,一种具有广泛和通用增强指令调整的微调代码LLM。我们的实验表明,WaveCoder在相同微调级别的不同代码相关任务中的泛化能力方面优于其他开源模型。此外,WaveCoder在以前的代码生成任务中表现出很高的效率。因此,本文对指令数据生成和微调模型领域做出了重大贡献,为提高代码相关任务的性能提供了新的见解和工具。

1 引言

2 CodeOcean:四任务代码相关指令数据

3 实验

4 消融与分析

已下架不支持订阅

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值