ASTRAIOS: Parameter-Efficient Instruction Tuning Code Large Language Models

最新推荐文章于 2025-11-25 12:11:01 发布

UnknownBody

最新推荐文章于 2025-11-25 12:11:01 发布

阅读量433

点赞数 12

CC 4.0 BY-SA版权

文章标签：语言模型人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c_cpp_csharp/article/details/135954821

LLM 日更专栏收录该内容

828 篇文章

已下架不支持订阅

ASTRAIOS是一个包含28个使用7种调优方法和4种不同规模的OctoCoder模型的套件，研究了全参数微调与参数有效微调在代码理解和生成任务中的性能。研究发现，全参数微调通常效果最好，而LoRA在成本与性能之间有良好平衡。大模型可能在稳健性和安全性方面表现较差，验证损失可作为下游性能指标。

本文是LLM系列文章，针对《ASTRAIOS: Parameter-Efficient Instruction Tuning Code Large Language Models》的翻译。

ASTRAIOS：参数高效指令调优代码大型语言模型

摘要
1 引言
2 ASTRAIOS套机与基准
3 前言研究：交叉熵
4 主要结果：任务性能
5 更进一步分析
6 讨论
7 相关工作
8 结论

摘要

大型语言模型（LLM）的全参数微调（FFT）的高成本导致了一系列参数有效微调（PEFT）方法。然而，目前尚不清楚哪些方法在不同的模型规模下提供了最佳的性价比权衡。我们介绍ASTRAIOS，这是一套由28个指令调优的OctoCoder模型组成的套件，使用7种调优方法和4种模型大小，最大可达160亿个参数。通过对5个任务和8个不同数据集（包括代码理解和代码生成任务）的调查，我们发现FFT通常在所有尺度上都能获得最佳的下游性能，并且PEFT方法在基于模型尺度的功效上存在显著差异。LoRA通常在成本和性能之间提供最有利的权衡。对这些方法对模型稳健性和代码安全性的影响的进一步研究表明，较大的模型往往表现出较差的稳健性和较低的安全性。最后，我们探讨了更新参数、交叉熵损失和任务性能之间的关系。我们发现，在小模型中观察到的调整有效性可以很好地推广到大模型，并且指令调整中的验证损失可以作为整体下游性能的可靠指标。

1 引言

2 ASTRAIOS套机与基准

3 前言研究：交叉熵

4 主要结果：任务性能

5 更进一步分析

6 讨论

了解本专栏

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。