- 博客(921)
- 收藏
- 关注
转载 美团 LongCat Interaction 团队发布大模型交互系统技术报告 WOWService
LongCat团队正式发布——「WOWService 大模型交互系统技术报告」,深度拆解了 「数据与知识双驱动」「自我优化训练」「四阶段训练流水线」「多 Agent 协同」 四大核心技术框架,希望对行业发展提供参考与启发。
2025-11-20 19:59:21
47
原创 美团开源LongCat-Audio-Codec,高效语音编解码器助力实时交互落地
针对 Speech LLM 落地中的音频处理难题,美团 LongCat 团队正式开源专用语音编解码方案 LongCat-Audio-Codec。真正让语音大模型既 “听懂” 语义,又能够“说清” 。
2025-11-14 10:28:08
876
转载 美团 LongCat 团队发布全模态一站式评测基准UNO-Bench:揭示单模态与全模态能力的组合规律
该基准通过科学的评测框架,首次揭示了多模态智能并非简单的线性叠加,而是遵循着一种乘积规律,这一规律在能力较弱的模型上体现为瓶颈限制,而在顶尖模型上则表现为协同增益的特性,这个全模态大模型的“组合定律”为行业提供了一种全新的、跨越模型规模的分析范式。为实现自动化评估,LongCat团队还提出了一个通用评分模型,通过对问题类型进行细分(如图7所示),并结合人工和自动标注多轮质量迭代的数据集(如图6所示),使其能够支持6种通用问题类型的自动评分,在分布外的模型和基准测试中达到了95%的准确率。
2025-11-13 19:59:29
54
转载 美团开源 LongCat-Audio-Codec,高效语音编解码器助力实时交互落地
(4 个码本,0.87kbps):词错误率(WER,越低表示语音可懂性越高)仅 1.48,语音质量感知评估(PESQ,越高表示主观音质越好)达 2.30,短时客观可懂性(STOI,越高表示语音信息保留越完整)达 0.921,说话人相似度(SECS)0.942,兼顾可懂性与音色一致性;同时,该方案支持声学码本的动态配置,可以在保证语义能力一致的情况下,根据下游任务调整码本层数。随后基于已有语义信息,结合改进的量化技术,在大码本空间下补充韵律、音色等副语言特征的声学 Token,解决非语义信息覆盖不足的问题。
2025-11-13 19:59:29
45
原创 报名&赠书|NeurIPS 2025美团论文精选及分享会
随着生成模型在图像合成等领域的突破性进展,基于生成模型的概率预测方法逐渐成为研究热点,但现有方法普遍存在两个关键局限性:一方面依赖递归生成机制或多步去噪过程,导致预测效率低下,尤其制约了长周期预测场景的应用;大量实验表明,与现有方法相比,我们的方法达到了最先进的性能。然而,这些模型在推理过程中会产生显著的计算和内存开销,极大地阻碍了其在实际场景中的高效部署。)中表明,TemporalRLT在显著减少训练数据的情况下,性能优于有监督微调和现有RLT方法,凸显了奖励设计与数据选择在视频推理中的重要性。
2025-11-13 19:59:29
1004
原创 LongCat-Flash-Omni正式发布并开源:开启全模态实时交互时代
LongCat-Flash系列再升级,美团正式发布全新家族成员——LongCat-Flash-Omni,在文本、图像、视频理解及语音感知与生成等关键单模态任务中,均展现出极强的竞争力。LongCat-Flash-Omni 是业界首个实现 “全模态覆盖、端到端架构、大参数量高效推理” 于一体的开源大语言模型。
2025-11-03 15:15:53
735
转载 VitaBench:基于复杂生活场景的交互式 Agent 评测基准
美团 LongCat 团队正式发布当前高度贴近真实生活场景、面向复杂问题的大模型智能体评测基准——VitaBench(Versatile Interactive Tasks Benchmark)。VitaBench 以外卖点餐、餐厅就餐、旅游出行三大高频真实生活场景为典型载体,构建了包含 66 个工具的交互式评测环境,并进行了跨场景的综合任务设计。
2025-11-03 10:24:59
103
转载 LongCat-Video 视频生成模型正式发布,探索世界模型的第一步
作为基于 Diffusion Transformer(DiT)架构的多功能统一视频生成基座,LongCat-Video 创新通过 “条件帧数量” 实现任务区分 —— 文生视频无需条件帧、图生视频输入 1 帧参考图、视频续写依托多帧前序内容,原生支持三大核心任务且无需额外模型适配,形成 “文生 / 图生 / 视频续写” 完整任务闭环。同时,从根源规避色彩漂移、画质降解、动作断裂等行业痛点,保障跨帧时序一致性与物理运动合理性,完美适配数字人、具身智能、世界模型等需要长时序动态模拟的场景需求。
2025-10-27 10:25:15
125
原创 ICCV 2025 | 美团论文精选及多模态推理竞赛冠军方法分享
本文介绍了美团技术团队在国际顶会ICCV 2025中发表的5篇论文。同时,在ICCV 2025 举办的多模态推理竞赛中,美团基础研发平台/计算和智能平台组建的ActiveAlphaAgent团队,斩获赛题1真实场景视觉定位(VG-RS)冠军,赛题2空间感知视觉问答(VQA-SA)季军和赛题3创意广告视频视觉推理(VR-Ads)季军。本文也分享了这三道赛题的解题思路,希望相关研究能给同学们带来一些帮助或启发。
2025-10-24 10:24:30
1163
转载 IROS 2025 | 美团机器人研究院学术年会,具身智能大咖观点交锋
在深圳市科技创新局的指导下,美团机器人研究院与清华大学深圳国际研究生院联合举办「2025年美团第三届低空经济智能飞行管理挑战赛」,本届大赛以视觉语言导航在空地协同中的应用探索为赛题,开设「性能赛」与「创意赛」两大赛道,面向全球高校开放,吸引384名学生报名,最终15支参赛队伍脱颖而出,并在今年首次举办了性能赛线下决赛。这一主题,针对第一性是什么、软硬件的关系与协同、具身数据的多样性与质量、未来机器人的核心特质等问题展开深度对话,为现场热情高涨的年轻学子带来诸多启发。《人工智能时代的机器人感知、规划和控制》
2025-10-24 10:24:30
167
原创 从0到1建设美团数据库容量评估系统
美团数据库团队推出了数据库容量评估系统,旨在解决数据库容量评估与变更风险防控等领域难题。本文介绍了系统架构和主要功能:系统使用线上流量在沙盒环境回放验证变更安全,结合倍速回放技术探测集群性能瓶颈,构建容量运营体系实现集群容量观测与治理闭环。系统具备数据操作安全、结果真实可靠、灵活高效赋能等特点,有效提升数据库稳定性与资源利用率。
2025-10-16 19:58:44
662
转载 可验证过程奖励在提升大模型推理效率中的探索与实践
美团业务研发搜推平台部算法团队创新提出可验证过程奖励机制(VSRM),针对大模型推理中的冗余回复与过度思考问题,精准奖励有效推理步骤,显著缩减输出长度并提升推理效率。VSRM通过步骤级正确率增益评估,有效抑制无效步骤,兼容主流强化学习算法,助力高效、可靠的复杂推理任务。
2025-10-09 19:58:39
151
转载 LongCat-Flash-Thinking 正式发布,更强、更专业,保持极速!
为了克服当前开源通用大型语言模型在形式化证明任务中的不足,我们针对形式化推理设计了一套全新的基于专家迭代框架的数据合成方法,该流程利用集成了 Lean4 服务器的专家迭代框架,生成经过严格验证的证明过程,从而系统性提升模型的形式化推理能力。LongCat-Flash-Thinking 在 MiniF2F-test 基准中的 pass@1 获得67.6的分数,大幅领先所有其他参与评估的模型,在 pass@8 和 pass@32 中同样保持了领先优势,凸显其在生成结构化证明和形式化数学推理方面的绝对优势。
2025-09-22 19:59:26
224
原创 开源 | InfiniteTalk:无限长虚拟人视频生成的新范式
目前,已在 GitHub 开源并获 1.6K Stars, Hugging Face 月下载量 64.8K,受到了很多好评,能够应用到电商直播、教育、影视等领域。
2025-09-22 19:59:26
1832
原创 LongCat-Flash:如何使用SGLang部署美团Agentic模型
SGLang 团队是业界专注于大模型推理系统优化的技术团队,提供并维护大模型推理的开源框架SGLang。近期,美团M17团队与SGLang团队一起合作,共同实现了LongCat-Flash模型在SGLang上的优化。欢迎大家体验。
2025-09-11 19:59:28
860
原创 美团正式发布并开源 LongCat-Flash-Chat,动态计算开启高效 AI 时代
我们正式发布 LongCat-Flash-Chat,并同步开源。LongCat-Flash 采用创新性混合专家模型(Mixture-of-Experts, MoE)架构,总参数 560 B,激活参数 18.6B~31.3B(平均 27B),实现了计算效率与性能的双重优化。
2025-09-01 14:55:55
1875
原创 美团 M17 团队开源 Meeseeks 评测集:揭秘大模型的 “听话”能力
针对大模型知识推理能力与指令遵循能力存在表现差异的现象,为推进指令遵循能力的系统化研究与精准评估,美团 M17 团队推出全新评测基准 Meeseeks,并在魔搭社区、GitHub、Huggingface等开源平台上线。
2025-08-28 19:59:07
1169
原创 可信实验白皮书系列08:开放式分析引擎 | 附PDF合集下载
本篇为《可信实验白皮书》系列的最后一篇内容,主要分享了AB实验分析方法库在美团的实践。同时,我们也为大家准备了一份该系列全集的PDF文档,希望能够帮助到更多从事AB实验工作的同学们。
2025-08-21 19:58:52
852
原创 美团智能头盔研发实践系列01:硬件设计篇
本文系《美团智能头盔研发实践》系列的第一篇文章,聚焦硬件设计维度。针对外卖骑手传统头盔佩戴体验不佳等痛点,从安全保障、体验优化、效率提升三大方向切入,详细解析安全防护、多传感器预警、通风减重、长效续航、音频降噪、工艺控制等关键技术,并提炼研发过程中行之有效的设计经验。
2025-08-14 19:58:46
1509
原创 美团智能头盔研发实践系列02:软件功能篇
本文系《美团智能头盔研发实践系列》的第二篇文章,围绕智能头盔如何通过主动安全和被动安全相结合的方式有效保护骑手,主要包括智能头盔骑行通话质量强化、智能语音助手、碰撞摔倒监控等三项软件能力。
2025-08-14 19:58:46
1309
原创 ACL 2025 | 美团技术团队论文精选
本文介绍了美团技术团队在国际顶会ACL 2025中发表的8篇论文,研究方向覆盖了生成式检索算法、多目标偏好对齐训练、富文本图像理解、搜索词推荐、跨语言迁移能力、多模态数学推理、第三人称任务等技术领域,希望相关研究能给同学们带来一些帮助或启发。
2025-07-31 19:58:46
1397
转载 NoCode 重磅升级!丝滑体验 +Database 开挂,速来解锁新玩法
不管是文件、图片,还是音频,都能直接上传到 NoCode 的 Database 里,还能灵活应用到自己的作品中。更便捷的是,执行完 SQL,前端代码还能自动修改,和后端存储逻辑自动适配!灵活性拉满,各种类型的文件资源都能轻松管理和调用,应用功能瞬间丰富起来!快来用 NoCode 创作属于你的作品并在 B 站投稿作品相关视频,在三大赛道中释放你的灵感创意,赢取活动专属纪念徽章和各种团团周边 🎁。Database 整体使用流程的升级是本次更新的一大亮点,新增自动执行 SQL、自动修改代码逻辑的功能,
2025-07-17 19:58:52
332
转载 美团开源OIBench与CoreCodeBench:揭示大模型编程能力的真实水平
Meituan-M17 团队联合上海交大等机构,分别推出了 OIBench(聚焦高区分度算法题评测)与 CoreCodeBench(聚焦多场景工程级代码基准)两大数据集,旨在揭示大模型编程能力真实水平,这两大数据集已分别在GitHub和Huggingface上进行开源。欢迎大家体验。
2025-07-17 19:58:52
432
转载 「NoCode·无界校园行」作品征集活动启动,首站清华,更多高校即将开启
活动深度融合 AI Coding 与 AI Agent 前沿技术,见证代码自动生成的神奇,提前掌握下一代开发者的核心技能。本活动限清华大学在校学生参与,主办方将对获奖者身份进行二次核验,对于不符合本活动要求的参与者将取消其获奖资格及参与资格。,评选出一、二、三等奖及优秀作品奖,颁发定制奖杯 + 奖金。平台,这是一款无需编程背景和经验,通过自然语言和对话形式,即可快速生成应用的平台。下方二维码加入创作者群,获取专业答疑,还有活动最新动态抢先知晓!清华赛区的作品征集活动,仅限清华在校学生参与,本硕博不限。
2025-07-03 19:59:12
281
原创 相约IROS 2025现场!美团第三届低空经济智能飞行管理挑战赛报名开始
美团第三届「低空经济智能飞行管理挑战赛」启动!本届挑战赛面向「国内外高校在校大学生」。大赛总奖金池40万元,最高单项奖10万元。
2025-07-01 15:14:15
801
原创 NoCode技巧分享:巧用提示词,做一个赛博朋克风的网站
场景1:想制作一个博客网站,但文章分类、评论互动、SEO 优化这些功能搅成一团,不知该怎么拆解实现?场景2:想实现一个赛博朋克风界面,可除了 「霓虹灯」「机械感」 又说不出具体细节?别让模糊需求卡住你的创意!试试提示词优化功能,或许能帮助你事半功倍!
2025-06-19 19:58:56
638
原创 JDK高版本特性总结与ZGC实践
美团信息安全技术团队核心服务升级JDK 17后,性能与稳定性大幅提升,机器成本降低了10%。高版本JDK与ZGC技术令人惊艳,且Java AI SDK最低支持JDK 17。本文总结了JDK 17的主要特性,然后重点分享了JDK 17+ZGC在安全领域的一些实践,希望能对大家有所帮助或启发。
2025-06-19 19:58:56
1257
原创 可信实验白皮书系列06:观察性研究
然而,常用的评估方法在处理这些局部全量策略效果时存在一定的局限性:首先,单重差分法假设功能或策略是唯一的影响因素,但现实中市场环境复杂,影响因素多样,使得这一假设难以成立。其次,倾向分匹配法(考虑到我们得到的因果效应可能并非完全由干预引起,可能存在一些随机因素,我们需要通过稳健性检验来排除随机因素的影响,此时可以考虑改变干预时间节点进行稳健性检验:即通过提前或延后干预时间,创造一个虚拟干预时间节点,观察在这种情况下得到的平均因果效应,与真实干预时间点的平均因果效应是否存在显著差异。
2025-06-19 19:58:56
1271
原创 无需代码!美团 NoCode 像聊天一样轻松搭建你的专属网站
特别推荐一款由美团技术团队打造的 AI 编程类产品——NoCode,可以像聊天一样轻松搭建你的专属网站、游戏、各种小工具等等,当然还有更多的隐藏功能等你发现,文末我们还准备了互动奖励,期待跟大家一起,开启全新的 AI 编程之旅。
2025-06-12 19:59:02
753
原创 MTGR:美团外卖生成式推荐Scaling Law落地实践
美团外卖推荐算法团队基于HSTU提出了MTGR框架以探索推荐系统中Scaling Law。MTGR对齐传统模型特征体系,并对多条序列利用Transformer架构进行统一建模。通过极致的性能优化,样本前向推理FLOPs提升65倍,推理成本降低12%,训练成本持平。
2025-05-15 19:58:50
2920
原创 招聘 | 美团 AI 搜索:致力用 AI 技术创造极致的搜索和交互体验
我们正在寻找「AI 狂热分子」——能让搜索结果秒懂用户灵魂需求的算法魔法师、精准雕琢搜索体验的算法工程技术革新者敢用大模型重构搜索逻辑的技术造浪者、深耕算法工程实践的大模型架构驾驭者愿用数据和代码解锁智能边界的未来架构师、用工程代码与数据打破技术边界的技术领航人
2025-05-08 19:59:19
975
原创 OR算法+ML模型混合推理框架架构演进
本文介绍了OR算法+ML模型混合推理能力建设思路及业务背景,此场景相比常规模型推理更具特殊性和复杂性,在工程实现上面临多维挑战,因此本文分别从性能、稳定性和扩展性三个维度分析问题和解法。
2025-05-08 19:59:19
1032
原创 让每个人都能有一个专属的生活小秘书 | Native AI Agent 集结号
目前美团积极推进AI战略,正研发一款全新的AI Native Product,未来会推出一个覆盖美团餐饮酒旅等所有服务的 AI 助手,致力于让每个人都可以拥有一个专属的生活小秘书。通过美团覆盖全国的消费场景和扎实的履约能力,这款产品不仅能提供信息建议,更能直接落地为真实的服务体验,真正推动 AI 从虚拟交互走向物理世界的需求满足。2025年,我们将聚焦技术影响力突破与业务价值深挖,持续夯实搜索与内容智能的行业技术壁垒,以算法创新驱动业务增长,携手打造本地生活服务领域的标杆技术团队!
2025-04-10 19:59:00
1266
原创 论文解读及活动预告 | ICLR&CVPR 2025美团技术团队论文精选
本文对美团技术团队在国际顶会CVPR 2025、ICLR 2025中发表的10篇论文进行介绍,这些论文是我们在图像生成、通用视觉分割、多模态文档理解、视频理解大模型、大模型效果评估、大语言模型的对齐和量化方法等方向上的技术沉淀和应用。
2025-04-10 19:59:00
1458
转载 上海交大-美团联合论文:长Prompt对齐问题也能评估了 | CVPR 2025
今年,CVPR共有13008份有效投稿并进入评审流程,其中2878篇被录用,最终录用率为22.1%。从录用论文上来看,多模态相关内容仍是关注重点。上海交通大学-美团计算与智能联合实验室发布的论文()也被录用,论文提出了Q-Eval-100K数据集与Q-Eval-Score评估框架。论文致力于解决以下问题:现有的文本到视觉评估数据集存在关键评估维度缺乏系统性、无法区分视觉质量和文本一致性,以及规模不足等问题;评估过程复杂、结果模糊,难以满足特定评估需求,限制了基于大模型的评估模型在实际场景中的应用。
2025-03-27 19:59:27
642
转载 空降香港!美团无人机率先在港启航
未来,美团无人机将持续提升香港航线的服务能力,深挖市场潜力,紧密融合本地产业,为香港打造智能物流新生态添砖加瓦,在全球低空物流领域稳步前行,助力香港低空经济发展迈向新高度。为了能够顺利在香港开通无人机配送服务,2024年11月香港低空经济监管沙盒发布后,美团无人机第一时间提交了申请,并针对无人机配送的安全能力、调度能力、隐私保护、通信能力等提交了详细的运行方案、测试报告和第三方检验证明,因此获批入选第一批沙盒项目,未来还会在沙盒试运行期间配合监管方要求持续开展安全、隐私、信号等测试。提升城市物流整体效率。
2025-03-20 19:59:27
443
转载 美团大模型北斗实习计划2025 FAQ
此外,同学们可以登录美团校招官网,进入“投递记录”查看招聘进展,也可以通过“美团招聘”公众号,点击下方的“校招主页”按钮,侧边栏点击“个人中心”,查看招聘进展。A3:大模型北斗实习计划是针对大模型领域的头部人才实习计划,可体验真实业务场景、海量数据和计算资源,并与美团最优秀研究者深度结对,获得一对一科研指导,联合发表高水平论文、申请专利等。A11:原则上,同学们在实习过程中不得退出项目,如因自身原因不得不退出,需提交申请,由美团确认后退出项目组。,在邮件标题请注明“大模型北斗实习计划 2025”。
2025-03-20 11:12:13
1120
转载 2025 | 美团大模型学术论文精选
美团科研合作致力于搭建美团技术团队与高校、科研机构、智库的合作桥梁和平台,依托美团丰富的业务场景、数据资源和真实的产业问题,开放创新,汇聚向上的力量,围绕机器人、人工智能、大数据、物联网、无人驾驶、运筹优化等领域,共同探索前沿科技和产业焦点宏观问题,促进产学研合作交流和成果转化,推动优秀人才培养。本文精选美团技术团队在大模型方向沉淀的最新学术论文,内容覆盖大语言模型、大模型系统与架构优化、多模态理解与生成、大模型评测等方向,希望能够给大家的学习和工作带来一些帮助或者启发。
2025-03-19 16:56:51
1281
转载 空降复旦!上海首条高校无人机配送航线启航
在上海这座充满活力的城市,每一位复旦大学的学子,都在寻找着便捷与美味的最佳答案。是在拥挤的食堂大排长龙,还是在忙碌的课间饥肠辘辘?是在等外卖的时光里焦虑踱步,还是在取餐的路上匆匆奔波?现在,答案揭晓!近日,美团无人机在复旦大学正式开航,打造上海首条高校场景无人机配送航线。这不仅是一次配送方式的创新,更是科技与生活的完美融合。当无人机带着热气腾腾的美食,穿越校园的绿树红墙,还有谁会甘愿在漫长的等待中...
2025-03-13 19:59:08
1221
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅