PolyRouter：AI 调度员为你砍掉30%大模型成本！-优快云博客

哪个大模型最好用？

“老板，我们公司现在有一堆大模型，有的擅长聊天，有的擅长写代码，有的擅长分析数据……每次来了新任务，该派哪个模型出马好呢？”

这可不是一个简单的问题。派错了模型，不仅效果差，还要多花钱。

有没有一种方法，能自动挑选最合适的模型来完成任务呢？

最近，有研究人员就提出了一个叫PolyRouter的系统，能智能调度各路AI大模型，让它们各司其职、发挥所长。

这个系统有多牛？

据说能砍掉30%的成本，还能让查询吞吐量提升40%！

什么原理呢？一起来看看这个"AI调度员"是如何工作的。

智能路由，让AI各显神通

首先，研究团队发现了一个问题：没有哪个大模型能在所有任务上都胜过其他模型。

这就好比一个公司里，有的员工擅长销售，有的擅长技术，有的擅长管理，没有全能选手。

那么，怎么才能让每个"AI员工"都物尽其用呢？

研究人员的思路是：建立一个智能调度系统，根据任务的特点，自动选择最合适的模型来完成。

这个系统主要包含三个步骤：

准备训练数据：收集各种领域的指令数据集，让每个专家模型都试着回答一遍，然后用BERT相似度评分给出"软标签"。
训练路由模型：把指令文本转换成向量，然后训练一个分类器，学会把不同类型的指令分配给不同的专家模型。
部署使用：新来一个查询，系统先编码成向量，预测最适合的专家模型，然后把任务转发给这个模型处理。

听起来是不是有点像公司里的调度员？根据每个人的特长，把不同的任务分配给最合适的人选。

那这个"AI调度员"到底有多聪明呢？

成本砍30%，效率提40%

研究人员设计了好几种路由方法来一较高下：

随机路由：闭着眼睛随便选一个模型（这不就是瞎指挥嘛）
最近邻路由：看哪个模型以前处理过最相似的任务（有点像按经验分配）
MLP路由：用一个简单的神经网络来预测（算是初级AI了）
BERT路由：用更强大的语言模型来理解任务（这就是高级AI了）

猜猜谁赢了？

没错，就是那个最高级的BERT路由！它的表现简直亮瞎眼：

成本降低了30%（老板最爱听这个）
查询处理速度提高了40%（用户最喜欢这个）
BERT相似度得分提高了11%（这说明回答更准确了）
负对数似然降低了6%（听不懂没关系，反正就是更好了）

看来不是简单地把任务写个规则甚至随机分配给不同模型就行了，还是得用AI来调度AI啊！

这就是所谓的"元学习"——用AI来学习如何更好地使用AI。

这不禁让人联想到现实世界的管理学：优秀的管理者往往不是每项工作都做得最好的人，而是最懂得如何分配工作的人。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述