中国人工智能公司DeepSeek(深度求索)以“低成本、高效率、强开放”的研发范式横空出世,火遍并震撼全球科技圈;DeepSeek展现出来的核心竞争力,除了低成本及推理能力,更重要的是开源模型能力追赶上了最新的闭源模型;而对具身智能领域影响最大的当属于其开源大模型DeepSeek-R1。
2024年1月20日,公司发布全球首个完全通过强化学习训练的专注于推理任务的高性能语言模型DeepSeek-R1,在数学、代码、自然语言推理等任务上,性能比肩OpenAI于2024年12月发布的ol正式版模型为具身智能领域带来了新的技术思路和发展机遇,并有望重构行业的竞争格局。
据光大证券分析师梳理,基于开源DeepSeek-R1,人形机器人有望从两个方向受益:
-
从单模态到多模态,有望实现更好的“大脑”;目前,在主流的具身智能大模型中,普遍采用VLM(视觉语言大模型)作为骨干,承担“task planning”的任务,即所谓的“大脑”;目前Deepseek团队也开发了系列大模型,如DeepSeek-VL2,大型混合专家(MoE)视觉-语言模型系列,具备较好的视觉语义对话能力;
-
开源的模型提升“大脑”水平,降低门槛,推动更多力量向“小脑”集中;以往的闭源模型使得很多具身智能团队需从头开发“大脑”和“小脑”;整体来看,由于训练数据的缺失,“大脑”的“task planning”能力相对成熟,而小脑的“motion planning”则较弱;Deepseek团队的开源策略,有望在“大脑”层面降低行业门槛,推动更多的力量向更底层的运控集中;
目前人形机器人第一股[优必选科技]已官宣:公司正在验证DeepSeek技术在人形机器人应用场景中的有效性;国内人形机器人企业[宇树科技]也被传已与DeepSeek达成深度合作;以及目前终止与O