数据受限语言模型的扩展研究

扩展数据受限语言模型

Niklas Muennighoff, Alexander M. Rush, Boaz Barak, Teven Le Scao, Aleksandra Piktus, Nouamane Tazi, Sampo Pyysalo, Thomas Wolf, Colin Raffel; 26(53):1−66, 2025.

摘要

当前扩展语言模型的趋势涉及增加参数数量和训练数据集规模。这一趋势的外推表明,训练数据集规模可能很快受到互联网上可用文本数据量的限制。受此限制的启发,研究在数据受限的情况下扩展语言模型。具体而言,进行了大量实验,改变数据重复的程度和计算预算,范围高达9000亿训练标记和90亿参数模型。研究发现,在固定计算预算下使用受限数据时,与使用唯一数据相比,使用多达4个周期的重复数据训练对损失的变化可以忽略不计。然而,随着重复次数增加,增加计算的价值最终衰减至零。提出并实证验证了一个计算最优化的扩展定律,该定律考虑了重复标记和多余参数的递减价值。最后,实验了缓解数据稀缺的方法,包括用代码数据增强训练数据集或移除常用过滤器。来自400次训练运行的模型和数据集可在 https://github.com/huggingface/datablations 免费获取。

[abs][pdf][bib]
[code]
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值