黑科技!大模型微调超并行执行技术,单卡GPU跑20个任务,吞吐量飙升20倍

一家叫RapidFire AI的初创公司,发布了一个开源的大语言模型微调引擎,能让你的单个GPU同时并行跑上多个任务,把实验吞吐量直接干到了惊人的20倍。

这事儿是谁干的?

RapidFire AI这家公司背后站着一位关键人物,阿伦·库马尔(Arun Kumar),他是加州大学圣迭戈分校(UCSD)计算机科学与工程系的教授。库马尔教授在数据库系统、机器学习和大规模数据管理这些领域有很深的功力,而RapidFire AI引擎里最核心的那个“超并行调度”和“动态控制”技术,理论基础就来自他的研究成果。

所以,这是正儿八经的学术研究转化。库马尔教授在公司里担任联合创始人和首席技术官(CTO)。

团队里还聚集了来自亚马逊网络服务(AWS)、顶尖AI研究机构和科技巨头的工程师与科学家。

阵容挺豪华的。

RapidFire AI在今年拿到了一笔400万美元的pre-seed轮融资。领投的是.406 Ventures,一家专注于早期科技投资的知名风投;还有AI Fund,这个基金的联合创始人是大名鼎鼎的吴恩达;此外还有Osage University Partners,这家机构专门投资高校的科研成果转化项目。

它到底解决了什么要命的问题?

想让一个通用的LLM(比如LLaMA)在你的专业领域(比如金融、医疗)更好用,就得对它进行微调。微调就像是给一个通才大学生进行专业培训,让他成为专家。

你需要调整一大堆参数。比如,现在很火的低秩自适应(LoRA)技术,它的“秩”该设成多少?模型的量化方案怎么选?给模型的指令,也就是提示(prompt)结构怎么设计?还有学习率这些超参数,以及强化学习里的奖励函数怎么定?

这些配置项排列组合起来,可能性多到无法想象。

而GPU资源宝贵又有限,大家通常只能搞

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值