12月17日,小米人车家全生态合作伙伴大会的聚光灯重新亮起。
在以往的小米发布会上,观众习惯了雷军穿着牛仔裤讲述硬核参数和感人故事,或是卢伟冰充满激情地描绘市场蓝图。但这一次,舞台中央出现了一张极具反差感的新面孔——罗福莉。

这位曾以8篇ACL顶会论文刷屏知乎、从DeepSeek核心团队被挖角至小米的95后技术专家,没有沿袭小米高管惯用的跑分对标或性价比话术。作为Xiaomi MiMo大模型团队的负责人,她在半小时的演讲中,用极其严谨的工程师视角,向外界抛出了小米AI的最新底牌——Xiaomi MiMo-V2-Flash。
从DeepSeek到MiMo
在演讲中,罗福莉直言,下一代的智能系统不应只是一个语言模拟器,而必须是一个能理解世界并与之共存的智能体。
这种技术价值观直接投射到了此次发布的MiMo-V2-Flash上。不同于友商竞相追逐千亿参数的臃肿模型,罗福莉团队带来的V2-Flash明显带有她前东家DeepSeek的影子——极致的效率与以小博大。该模型针对端侧芯片进行了深度剪枝与蒸馏,能在手机和车机有限的算力下,跑出接近云端大模型的推理速度。这正是小米作为硬件厂商最急需的能力。

在大会现场,她抛弃了冗长的概念普及,直接展示了MiMo模型在思维链(CoT)上的突破。罗福莉指出,AI进化的下一个起点,必须拥有物理模型的交互能力。这一点在小米的“人车家”生态中体现得淋漓尽致。
以小米汽车SU7为例,传统的智驾系统与座舱系统往往是割裂的。但在MiMo-V2的驱动下,车载Agent开始具备了通感。当用户发出模糊指令时,模型不再是进行简单的关键词匹配,而是基于对环境、车况、用户习惯的综合模拟进行推理。
这种能力被称为世界模型的雏形。它意味着AI不再是活在服务器里的聊天软件,而是真正渗透进了小米设备的传感器中。罗福莉团队的工作,实际上是在为小米海量的硬件设备植入一种通用的元认知能力,例如让吸尘器懂得避障背后的逻辑,让空调懂得温度调节与用户睡眠周期的因果关系。
场景即数据,硬件即躯体
罗福莉首秀的最大看点,在于她如何将顶级算法与海量场景打通。
目前的AI行业正陷入同质化竞争,单纯的模型能力已很难拉开差距。而罗福莉手中的牌,是其他纯软件大模型厂商无法比拟的。她拥有全球最丰富的硬件接口和真实场景数据。
在演讲中,她透露了MiMo团队的一个核心方向:端云结合的具身智能。小米的数亿台设备,正在成为MiMo模型训练的天然触手。通过在设备端部署Flash版本的小模型,处理实时感知数据;在云端部署超级大模型,处理复杂推理任务。这种架构让小米在落地Agent时,拥有了极高的成本优势和响应速度。
这或许正是雷军不惜重金挖角罗福莉的原因。在百模大战进入下半场时,小米需要的不再是跟随者,而是一位能从底层架构上定义AI+硬件新范式的领军人物。

过去几年,我们见证了太多的“参数内卷”。厂商们热衷于比拼谁的模型参数更大,谁在榜单上的分数更高。但用户端的感知却是割裂的。所有的“智能”都通过APP实现,而物理世界的设备依然“智障”。
罗福莉的出现,以及小米对Agent生态的全力押注,预示着行业正在从参数至上回归体验至上。科技不再是冷冰冰的数据堆砌,而是需要像罗福莉在演讲中所展现的那样,具有逻辑、温度和解决实际问题的能力。
小米的AI,终于不再只是一个会讲笑话的语音助手了。
220

被折叠的 条评论
为什么被折叠?



