2025年9月22日,美团人工智能实验室正式对外发布新一代高效推理大语言模型LongCat-Flash-Thinking。这款被命名为"闪电思维"的升级模型,在延续美团龙猫系列一贯的高效推理特性基础上,实现了逻辑推理、数学运算、代码生成及智能体交互等核心能力的全面突破,多项关键指标达到全球开源模型的领先水平,部分任务性能已接近业界顶级闭源模型GPT5-Thinking的技术水准。
据美团技术团队透露,LongCat-Flash-Thinking采用创新的混合推理架构,首次将非形式化推理与形式化定理证明能力深度融合,同时强化了智能体自主调用外部工具的决策能力。这种"双引擎+工具链"的技术架构,使模型在处理高复杂度任务时展现出显著优势,特别是在高等数学问题求解、多语言代码开发和复杂场景智能体交互等领域,性能提升幅度达到30%以上。该模型也因此成为国内首个具备"深度逻辑推理+多模态工具调用"复合能力的大语言模型,填补了国内在该技术领域的空白。
技术专家指出,LongCat-Flash-Thinking在形式化推理方面的突破具有重要行业意义。模型内置的自动定理证明器能够处理超过200种数学定理系统,支持从初等代数到高等微积分的全范围数学推理,在国际权威数学推理评测集MATH上实现了82.3%的解题准确率,较上一代模型提升15.7个百分点。在代码生成领域,模型通过强化的上下文理解机制,在HumanEval和MBPP两大国际权威代码评测基准上分别取得78.5%和81.2%的通过率,尤其在复杂算法实现和跨语言代码转换任务中表现突出。
为推动大语言模型技术的开放创新,美团已通过HuggingFace平台和官方代码仓库全面公开LongCat-Flash-Thinking的模型权重、训练代码及推理工具链。开发者可通过访问官方代码仓库(https://gitcode.com/hf_mirrors/meituan-longcat/LongCat-Flash-Thinking)获取完整技术资源,同时美团AI开放平台也提供了在线推理Demo服务,支持开发者实时测试模型在各类任务场景下的表现。这种完全开源的模式,不仅有利于学术界和产业界共同推进大语言模型技术的迭代优化,也为零售、金融、教育等行业的智能化转型提供了高性能、低成本的技术解决方案。
行业分析人士认为,LongCat-Flash-Thinking的发布标志着中国大语言模型技术正式进入"深度推理"时代。随着模型在商业场景的逐步落地,有望在智能客服、自动驾驶决策、工业质检等领域催生一批创新应用。美团表示,未来将持续投入大模型核心技术研发,重点突破超长上下文理解、多模态融合推理等前沿方向,同时与高校、科研机构共建开放生态,推动人工智能技术在产业经济中的规模化应用。目前,该模型已开始在美团内部业务场景进行试点应用,预计年内将逐步开放给合作伙伴使用。
此次美团发布的LongCat-Flash-Thinking模型,不仅展现了中国企业在大语言模型核心技术领域的创新实力,更为行业提供了兼顾高性能与实用性的技术范本。随着开源生态的不断完善和应用场景的持续拓展,这款融合深度推理与工具调用能力的新一代模型,有望成为推动人工智能技术从通用能力向行业深度应用转化的关键基础设施,为千行百业的智能化升级注入新动能。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



