作者简介
Quincy Qu,携程资深算法工程师,关注大模型应用场景的开发。
导读:本文来自于携程Quincy Qu的论文。该论文被COLING 2025 (Industry track) 收录(自然语言处理与计算语言学领域的顶级学术会议之一),并在阿联酋进行了分享。
作为顶级会议,COLING 吸引了来自全球顶尖研究机构和学者的参与,为来自相关领域的重要技术突破提供展示创新成果的绝佳平台。COLING认为,如今技术创新不仅仅来自于高校和科研院所,更来自工业界的研发部门。Quicy Qu论文从投递的数千篇论文中,经过严格评审,脱颖而出获得收录(收录率30%)。
论文介绍
在工业场景下,大量自然语言处理(NLP)任务需要同时上线,且每条请求都必须“准时、高准”。任务数量一多,算力、内存、运维成本便随之线性攀升。随着任务数量的增加,资源需求也随之增长。防止资源需求随着任务数量的增加而呈线性增长,成为节省成本中最关键的挑战之一。
传统方法通过各自的网络和pipeline分别处理每个任务。这导致了开发和维护的繁重工作量,以及增加的延迟和资源使用。此外,在大型语言模型(LLMs)的背景下,这还可能导致为每个任务扩展模型时产生过高的成本。我们提出利用多任务服务来部署 LLMs,而不是单任务服务。单任务服务和多任务服务是两种在线服务策略,它们的范式如图 1所示。与单任务服务相比,多任务服务由于共享机制减少了部署工作量并节省了更多内存,从而缓解了资源浪费。

图 1: 两种在线服务策略。(a) 为每个任务独立训练和部署单任务模型。(b)训练和部署一个多功能模型以处理所有任务。
然而,在现实应用中,多任务方法常常难以达到单任务方法的性能,这是由于数据不平衡和任务异质性。数据不平衡会导致低资源任务出现过拟合。但early stop对于高资源任务来说不是一个可行的解决方案;这些任务需要更多的轮次才能收敛。此外,异质性可能导致任务间的负迁移。不同的任务在模型最优化中需要不同的梯度方向,而差异太大的任务可能在梯度方向上产生冲突。
在本文中,我们提出一个三阶段框架:过滤不相似的任务、在高资源任务上进行微调,以及在所有任务的混合体上进行微调。任务过滤策略可以防止异构任务之间的负迁移。在高资源任务上进行微调,然后在混合体上进行微调的策略,通过允许不同任务具有不同的训练轮次,从而有效实现提前停止,防止低资源任务的过拟合或高资源任务的欠拟合。再是验证,我们发现我们的算法在性能上比其他多任务基准更接近单任务设置。我们观察到,多任务性能的提升主要来自于采样策略、任务过滤和领域特定的持续预训练。
我们的主要贡献可以总结如下:
提出了一种多任务服务框架,该框架利用大语言模型(LLMs)来提升多任务方法的效果,该方法可以同时处理多个任务,并且性能与单任务方法相当。
进行了全面的实验,结果表明我们的方案在不同基准上都具有实用性,并能够替代单任务方法训练的任务。我们还评估每个组件(如任务选择和采样策略)的重要性。
模型被部署到生产环境,为总共 11 个下游任务提供服务。与单任务服务相比,模型实现了相当的性能。我们估计,与单任务服务相比,我们的系统可以将总服务成本降低多达 90.9%。
更多详情,可下载论文原文阅读。
团队开放岗位
关于携程内容中心
这是一个「灵感-规划-分享」全场景为核心的创新团队,致力于打造权威旅行工具(智能地图规划/个性化线路生成)与沉浸式灵感社区(热点榜单/UGC生态)。在这里,你将用产品力重构用户心智——从完成交易到激发旅行灵感、提供更多内容信息,我们正在焕新出发,通过本地化内容升级×社交化传播策略,构建「工具+社区」双轮驱动的旅行新生态。加入这个年轻而锐意进取的团队,用代码与创意抢占千亿级旅行决策入口,见证从0到1的行业革新!
搜索/推荐算法工程师 点击投递简历
职位描述
1、负责携程搜推多场景召回与排序模型优化,提升点击、时长、互动、转化等核心指标;
2、负责搜索生成式问答相关技术研发,探索LLM,Agent等创新NLP技术与搜推业务的结合;
3、发现并解决搜索场景中在查询分析、意图识别、召回排序模型、相关性等方向的问题;
资深算法工程师(地理信息) 点击投递简历
职位描述
1、负责内容挖掘生产、AIGC等算法的实现和深度应用,技术点如: LLM训练和应用、多模态内容挖掘、相似度匹配等;
2、负责内容相关项目的需求开发,提升内容挖掘算法的效率和质量;
3、参与AI新技术研究和应用方案落地,包括不限于语言大模型等;
后端开发工程师(用户内容)点击投递简历
职位描述
1、参与SOA服务的需求分析及开发工作,确保服务的高可用性、扩展性和安全性;
2、负责服务性能调优,解决高并发场景下的技术问题,保障服务的稳定性和低延迟;
3、与上下游团队(如前端、测试、运维)紧密协作,确保服务全生命周期的高效交付;
4、分析和排查线上问题,快速响应并修复服务异常,制定预防性方案;
【推荐阅读】

“携程技术”公众号
分享,交流,成长
携程多任务服务框架降低90%成本
456

被折叠的 条评论
为什么被折叠?



