美团开源LongCat-Flash-Chat大模型:560B参数实现效率与性能双重突破

美团开源LongCat-Flash-Chat大模型:560B参数实现效率与性能双重突破

【免费下载链接】LongCat-Flash-Chat 【免费下载链接】LongCat-Flash-Chat 项目地址: https://ai.gitcode.com/hf_mirrors/meituan-longcat/LongCat-Flash-Chat

2025年9月1日,美团正式对外发布并开源新一代大语言模型LongCat-Flash-Chat。该模型凭借创新的混合专家(MoE)架构设计,在5600亿总参数规模下实现单token仅激活186亿至313亿参数的动态调节能力,平均激活量稳定在270亿参数水平,开创了大模型"轻量激活、高效运行"的技术新范式。

突破性架构设计实现算力精准分配

LongCat-Flash核心创新在于引入"零计算专家(Zero-Computation Experts)"机制,通过动态路由算法使模型能根据输入上下文智能选择激活专家模块。其架构图清晰展示了Multi-head Latent Attention(MLA)与Top-k Router协同工作的原理,配合FFN Expert与零计算专家组件形成高效计算网络。

这是美团LongCat-Flash大模型的架构图,展示了其采用的混合专家模型(MoE)架构,包含Multi-head Latent Attention(MLA)、Top-k Router、FFN Expert和Zero-computation Expert等关键组件。 如上图所示,该架构通过Top-k Router实现专家动态选择,零计算专家组件有效降低冗余计算。这一设计充分体现了美团在大模型架构创新上的技术突破,为开发者理解模型高效运行机制提供了直观参考。

训练过程中采用的PID控制器技术,通过实时微调专家偏置参数,将单token平均激活量精准控制在270亿参数,配合层间跨层通信通道的并行化设计,使模型在30天内完成训练。在H800硬件平台上,LongCat-Flash-Chat实现每秒生成超100token的推理速度,同时将单次输出成本控制在每百万token5元的行业超低水平。

智能体能力领先 多维度评测表现优异

作为专注推理效率的非思考型基础模型,LongCat-Flash-Chat在多项权威评测中展现出与主流大模型比肩的综合性能。在通用知识领域,其ArenaHard-V2基准测试获得86.50分位列第二;MMLU多任务语言理解得89.71分,CEval中文能力评估达90.44分,参数规模却小于DeepSeek-V3.1等同类产品。

在智能体工具使用场景中,该模型表现尤为突出:τ2-Bench评测超越参数规模更大的竞品,VitaBench复杂场景测试以24.30分斩获第一。编程能力方面,TerminalBench终端命令任务得39.51分位列第二,SWE-Bench-Verified软件工程师能力验证达60.4分。指令遵循领域更是全面领先,IFEval评测89.65分、COLLIE中文指令57.10分、Meeseeks-zh多场景43.03分,均居当前评测榜首。

图片展示了美团开源大模型LongCat-Flash-Chat的体验界面,包含欢迎语、问题输入框及“深度思考”“联网搜索”等功能按钮。 如上图所示,界面中的"深度思考"和"联网搜索"按钮直观体现了模型的智能体能力。这一设计展示了LongCat-Flash-Chat在实际应用场景中的交互方式,为用户快速体验模型核心功能提供了便捷入口。

全面开源赋能行业 开启高效AI应用新纪元

美团已通过GitCode平台全面开源LongCat-Flash-Chat模型,开发者可直接获取模型权重与技术文档。该模型的开源将推动大模型在智能客服、自动化办公、复杂任务处理等领域的应用落地,尤其适合需要长时间运行的复杂智能体场景。

LongCat-Flash-Chat的推出,标志着大模型产业从"参数竞赛"转向"效率优化"的技术新方向。通过架构创新实现的"高性能-低能耗-低成本"三角平衡,为行业提供了兼顾推理速度与计算效率的新范式。随着模型的开源普及,预计将加速AI技术在各行业的深度应用,特别是在对响应速度和运行成本敏感的智能体服务领域,有望催生一批创新应用场景。

未来,美团将持续优化模型性能,重点提升多模态理解能力与垂直领域适配性,通过开源社区共建方式,推动大模型技术向更高效、更普惠的方向发展。开发者可通过官方体验平台直接测试模型能力,或访问GitCode仓库获取完整技术资源。

【免费下载链接】LongCat-Flash-Chat 【免费下载链接】LongCat-Flash-Chat 项目地址: https://ai.gitcode.com/hf_mirrors/meituan-longcat/LongCat-Flash-Chat

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值