中国大模型的技术一号位们

导语

News Today

随着GPT等大模型技术的爆发,全球AI竞争进入白热化阶段。

中国AI企业如何在技术封锁、算力限制等挑战中突围?又是哪些人在背后推动技术的自主创新与落地应用?

本文将聚焦几位在中国AI大模型领域具有代表性的领导者,探讨他们的战略布局与技术成果!

1

DeepSeek

梁文锋

职位:DeepSeek(深度求索)创始人。

简介:梁文锋是DeepSeek的创始人,代表了中国AI领域的新生力量,其对技术趋势有敏锐洞察和对市场机会有极致把握能力。

主要成果:梁文锋及其团队花了3年时间在核心技术上进行深度积累,优化算法,打磨产品。当产品正式上线后,在短短20天内,团队连续更新了50多个版本,最终在20天内获得全球3000万日活用户,成为现象级产品。

行业影响:DeepSeek的成功展现了中国AI创业公司的技术实力和市场爆发力,其快速发展加剧了全球AI大模型领域的竞争,推动了AI技术的普及和应用。

更多关于大模型和人工智能的行业动态、技术进展、求职内推及问答交流,欢迎加入大模型之心Tech知识星球!星球内部已经汇总了完善的Agent/RAG/强化学习/通用大模型训练/部署技术栈,欢迎加入与我们一起同行。

2

通义千问

林俊旸

职位:通义千问(阿里云旗下产业级大语言模型)负责人。

简介:林俊旸是通义千问的核心负责人,深耕产业级AI领域十余年,兼具对大模型技术演进的前瞻性洞察与对实体经济数字化需求的精准把控,是推动AI技术从实验室突破走向产业规模化落地的关键推动者,代表了中国科技企业在“AI赋能千行百业”领域的核心力量。

主要成果:林俊旸带领团队依托阿里云十余年云计算与AI技术沉淀,聚焦大模型的产业适配能力打磨,攻克多模态交互、行业知识深度融入、低成本部署等核心技术难点。通义千问正式发布后,团队以“周级迭代”速度推进产品优化,半年内完成30余次版本升级,成功适配制造、金融、政务、医疗、教育等20多个重点行业场景,解决了企业在生产效率提升、客户服务升级、业务流程重构等关键需求,累计服务超10万家企业客户,成为国内产业级AI大模型的标杆产品。

行业影响:通义千问的落地成果打破了“大模型只聚焦C端体验”的认知局限,展现了中国科技企业在产业级AI领域的技术深度与场景落地能力。其对千行百业的赋能,不仅大幅降低了中小企业引入AI技术的门槛,加速了实体经济的数字化转型进程,更推动全球AI产业从“技术竞赛”向“价值落地”转型,为全球产业级AI发展提供了可借鉴的“中国方案”,进一步提升了中国在全球AI产业应用领域的竞争力。

3

字节Seed

吴永辉

职位:Google Fellow,曾担任谷歌DeepMind研究副总裁,现任字节跳动大模型团队Seed基础研究负责人。

简介:吴永辉是字节Seed的核心负责人,代表了中国 AI 应用型产品领域的中坚力量,其对用户日常核心需求有精准捕捉能力,对 AI 技术从 “技术研发” 到 “用户场景落地” 的转化有深刻理解,擅长以产品思维推动 AI 技术服务于普通用户。

吴永辉在人工智能领域拥有超过17年从业经验,长期任职于谷歌。2023年9月晋升为Google Fellow(谷歌院士),成为该公司技术体系最高职级成员。随后担任谷歌旗下人工智能研究实验室 DeepMind 的研究副总裁。2025年2月加入字节跳动,担任大模型团队Seed基础研究负责人 。其研究方向涵盖深度学习框架优化、多模态大模型架构设计等领域

主要成果:吴永辉及其团队长期投入 AI 核心能力打磨,在自然语言理解精度、多场景需求适配、交互体验优化等关键领域持续深耕。产品正式上线后,团队以 “快速响应用户反馈” 为导向,短期内密集迭代数十个版本,重点提升内容准确性、响应效率与场景覆盖度,最终短时间内突破千万日活,成为用户高频依赖的智能助手,广泛应用于办公文档处理、学习答疑解惑、生活服务咨询、创意内容辅助等日常场景。

行业影响:豆包的成功展现了中国 AI 产品在 “技术普惠化” 领域的实践实力与市场号召力,其对 “用户场景优先” 的聚焦,推动了 AI 技术从 “专业领域” 走向 “大众日常”,为行业提供了 AI 产品化落地的典型范式。同时,其对交互体验与场景适配的深耕,也带动了行业对 “AI 用户友好性” 的重视,进一步丰富了中国 AI 生态的应用维度,加速了 AI 在普通生活场景中的普及。

4

腾讯混元大模型

薄列峰

职位:2013年出任亚马逊首席科学家,曾任阿里巴巴通义实验室应用视觉团队负责人。于今年7月加入腾讯,担任混元大模型核心主导者,直接向腾讯副总裁兼混元项目负责人蒋杰汇报。

简介:薄列峰代表了中国 AI 领域深耕技术与产业融合的领军力量,对大模型技术演进路径有深刻判断,对 AI 赋能实体经济的落地机遇有精准把控能力。

曾任阿里巴巴通义实验室应用视觉团队负责人,华盛顿大学计算机科学与工程学院合聘教授 。2007年获西安电子科技大学计算机视觉博士学位,后于芝加哥大学丰田研究院和华盛顿大学从事博士后研究 。 2013年出任亚马逊首席科学家,主导Amazon Go无人零售店算法研发;2017年加入京东数字科技集团任AI实验室首席科学家,。2022年入职阿里巴巴后,负责通义实验室XR团队及应用视觉项目。2024年参与研发的EMO语音驱动肖像视频框架成为行业标杆,次年4月离职。

主要成果:薄列峰及其团队依托阿里多年 AI 技术积淀,在大模型核心架构、多模态融合、高效训练推理等关键技术上持续攻坚,历经多轮迭代打磨混元大模型。自模型发布以来,团队快速响应产业需求,半年内完成 8 次重大版本更新,相继实现代码生成精度提升、工业级多模态理解、复杂任务规划等能力突破;服务超 20 万家企业客户,同时赋能百度搜索、小度智能设备、自动驾驶等核心业务,让大模型能力切实转化为产业效率提升的动力。

行业影响:混元大模型的成功,展现了中国头部科技企业在 AI 核心技术领域的自主创新实力与规模化落地能力,进一步巩固了中国在全球大模型赛道的竞争优势。其对产业场景的深度渗透,推动大模型技术从 “技术探索” 迈向 “产业实用”,加速了金融、制造、医疗、教育等传统行业的智能化转型,同时带动了 AI 产业链上下游的协同发展,为全球大模型产业提供了 “技术 - 产业” 双向驱动的中国样本。

5

日日新大模型

徐立

职位:全国工商联人工智能委员会主席团首任轮值主席商汤科技董事长兼CEO,日日新大模型体系核心主导者。

简介:徐立是中国人工智能产业的领军者之一,深耕计算机视觉与通用AI领域十余年,兼具深厚的技术研发积淀与前瞻性的产业落地思维。他始终以“AI赋能百业”为核心方向,不仅是技术创新的推动者,更是AI从实验室走向产业场景的关键桥梁搭建者,代表了中国AI企业从技术突破到产业化落地的核心力量。

上海商汤智能科技有限公司创始人、董事长兼首席执行官,政协上海市第十四届委员会委员,新质企业家联合会会长。本硕毕业于上海交通大学,获香港中文大学博士学位,曾就职于摩托罗拉研究院、微软研究院等机构。2017年起连续入选《财富》“40岁以下商界精英”榜单,2020年获评中国最具影响力商界领袖

主要成果:徐立带领商汤科技历经近十年技术攻坚,率先构建起国内领先的AI大装置“SenseCore商汤AI大装置”,为日日新大模型的研发提供了算力、算法与数据协同的核心底座;日日新大模型自2023年发布以来,持续迭代多模态能力(覆盖文本生成、图像理解、视频分析、3D重建等),在技术测评中多次刷新通用AI能力榜单,同时快速落地至智慧城市(如交通智能调度、城市安防)、医疗健康(如医学影像辅助诊断)、智能制造(如工业质检、产线优化)及自动驾驶等领域。截至2025年初,依托日日新大模型的AI解决方案已服务超1000家大型企业客户,覆盖全球超40个国家和地区,成为推动产业智能化升级的核心引擎。

行业影响:日日新大模型的发展与落地,充分展现了中国AI企业在通用人工智能领域的技术沉淀与产业化实力,进一步强化了中国在全球AI竞争中的核心地位;其对传统行业的深度赋能,打破了AI技术“单点应用”的局限,推动AI向“全链条渗透”升级,同时带动了AI算力、算法优化、数据安全等上下游产业链的协同发展,为全球AI产业从“技术创新”向“价值创造”转型提供了可借鉴的“中国路径”。

6

Minimax

闫俊杰

职位:Minimax创始人兼CEO。

简介:闫俊杰是Minimax的创始人,作为中国AI大模型领域的核心创业者之一,他凭借对大模型技术演进规律的深刻洞察,以及对企业级应用与C端用户需求的精准把握,带领团队在竞争激烈的AI赛道快速立足,成为推动中国AI技术产业化落地的重要新生力量。

清华本硕,2015年博士毕业于中国科学院自动化所模式识别国家重点实验室。曾任商汤科技副总裁、研究院副院长及智慧城市事业群CTO,主导深度学习工具链及通用智能技术体系搭建。 2021年11月创立上海稀宇极智科技有限公司(Minimax),专注通用人工智能技术研发。2024年上半年推出国内首个商用万亿参数MoE架构大模型abab 6.5,主导发布开源模型MiniMax-01系列。2024年入选《财富》中国40位40岁以下商界精英榜。

主要成果:闫俊杰自2021年创立Minimax以来,便锚定大模型核心技术研发方向,带领团队历经数年深耕——在多模态理解、长上下文推理、低成本高效部署等关键技术领域持续攻坚,不断优化模型架构与算法效率,打磨技术底座。当团队推出核心产品“Abab系列大模型”及配套应用后,短期内完成数十次版本迭代,先后攻克“多场景适配”“低延迟响应”等用户核心痛点,目前已服务数万家企业客户,覆盖金融、教育、医疗等多个行业,同时积累千万级C端用户,形成“企业服务+C端应用”双驱动的产品矩阵,成为国内AI大模型领域兼具技术深度与落地能力的代表。

行业影响:Minimax的技术突破与商业化成果,充分展现了中国AI创业公司在大模型“技术转化为实用价值”环节的实力,其在垂直行业的深度布局进一步丰富了AI大模型的应用生态。同时,团队对“高效、低成本大模型”的探索,为行业提供了可借鉴的产业化路径,不仅加剧了全球AI大模型领域的竞争维度,更推动AI技术从“实验室走向规模化应用”,加速了AI普惠的进程。

7

月之暗面Kimi

杨植麟

职位:月之暗面(Moonshot AI)创始人,清华大学助理教授。

简介:杨植麟是月之暗面的创始人,拥有深厚的AI学术积淀与前沿技术视野——毕业于清华大学,后于卡内基梅隆大学(CMU)深耕自然语言处理与大模型研究,在该领域积累了多年核心经验。他对AI技术演进规律、大模型场景化落地机会具备精准判断力,是中国AI大模型赛道中兼具学术深度与产业洞察力的代表性领军者之一。

本科毕业于清华大学计算机系 ,博士毕业于卡内基梅隆大学计算机学院。曾效力于全球顶级人工智能机构Facebook AI Research, Google Brain;大模型企业月之暗面(Moonshot AI)创始人,清华大学助理教授,2019年度北京智源青年科学家,上海期智研究院PI。 杨植麟还曾参与过Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,其中主导开发盘古NLP大模型,获世界人工智能大会“2021SAIL 之星”称号。2022年4月28日,杨植麟入选AI华人青年学者榜单。 杨植麟是Transformer-XL与XLNet两篇重要论文的第一作者。

主要成果:杨植麟及其团队以“突破大模型能力边界”为核心目标,在技术研发上持续攻坚。团队推出的核心产品Moonshot Chat(Kimi Chat),凭借“超长文本处理”这一差异化优势(早期即支持20万字上下文,后续升级至百万字级),攻克了传统大模型处理长篇文档(如学术论文、专业报告、长篇小说)的痛点;产品正式上线后,团队保持高效迭代节奏,短时间内完成数十次版本更新,快速覆盖科研辅助、法律文书分析、长篇内容创作等专业场景,上线不久便收获千万级用户关注,成为国内大模型领域聚焦“专业场景价值”的现象级产品。

行业影响:月之暗面的成功,展现了中国AI创业公司在大模型细分技术领域(如超长上下文处理)的突破性实力,其“技术深耕+场景精准”的发展路径,带动行业从“通用对话”向“专业领域落地”聚焦,推动AI技术在科研、法律、医疗等专业场景的实用化进程;同时也进一步丰富了全球AI大模型的技术方向,加剧了全球大模型领域在细分技术赛道的竞争,为AI产业的多元化发展注入动力。

8

文心一言

王海峰

职位:百度首席技术官(CTO)。

简介:王海峰是百度集团首席技术官,深度学习技术及应用国家工程研究中心主任,兼中国电子学会、中国中文信息学会副理事长等。他是自然语言处理领域国际知名专家,在机器翻译、自然语言处理、知识图谱和智能搜索等方面取得大量领先和开创性成果。

主要成果:王海峰带领团队打造了百度飞桨(PaddlePaddle)深度学习平台,使之成为中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。他亦全面负责百度人工智能方向的技术研发和商业化落地,包括百度大脑、文心大模型(ERNIE)等核心体系的构建,推动百度AI在搜索、云计算、自动驾驶、智能硬件等众多业务领域的应用。

行业影响:王海峰领导的百度AI技术体系,奠定了百度在中文AI领域的领军地位。飞桨平台降低了中国AI开发者的门槛,支撑了中国广泛的产业智能化需求。文心大模型系列亦是中国最具代表性的大模型之一,推动了生成式AI在国内的普及和发展。

结语

从学术研究到产业落地,从技术突破到生态构建,这些AI先锋们正在书写中国智能时代的新篇章。他们的故事说明,唯有持续创新、深入场景、拥抱用户,才能在激烈的全球竞争中站稳脚跟。未来已来,中国AI的下一站,值得期待。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值