6月11日,地瓜机器人发布行业首款单SoC算控一体化机器人开发套件RDK S100。
RDK S100采用大小脑架构设计,并且将大脑、小脑功能模块集成于单SoC平台,不仅降低了硬件成本,还带来整体性能的提升。RDK S100支持具身智能大小模型高效协作,还提供了丰富的外围接口和软硬协同、端云一体的全链路开发基础设施支持。
地瓜机器人开发者生态副总裁胡春旭透露,明年第一季度,地瓜机器人还将推出更多大算力产品,包括面向端到端开发的算力产品。
胡春旭介绍,端到端模型虽然具有通用性强、可自动适应环境变化等优势,但需要海量数据训练、消耗大量计算资源,而分层决策模型具有相对可控、实现难度相对较低,且可解释性高的特点,是目前机器人走向具身智能较为可行的方案。
针对分层决策模型的大小脑结构,需要兼顾低功耗和多样化算力组合的单SoC平台提供计算支持。RDK S100在单一SoC上整合了CPU+BPU+MCU,能够实现“感知+决策+行动”三位一体。
具体来说,RDK S100的大脑采用6核心 Arm Cortex-A78AE CPU,前者支持实时内核,具备高效调度和低延迟的特性;搭配80TOPS算力的BPU,专为CNN和Transformer优化,推理更快、功耗更低,能够满足各类复杂决策和规划任务的计算需求。
其小脑则是由4核心Arm Cortex-R52+MCU组成,为机器人提供了高帧率、低延迟的关节实时控制能力,满足各种实时运控场景的计算需求。
这种架构使RDK S100能够支持大小模型的动态融合、无缝切换。一方面,可通过部署视觉/点云检测、LLM、VLM等热门模型,为机器人决策和运行提供准确数据支持。
另一方面,还能够部署多种运控模型,提供稳定可靠的高速高精度运动控制,同时基于MCU与BPU的紧密搭配,降低80%的CPU负载,提高机器人的反应速度。
以“请帮我拿取杯子”为例,当人类下达指令后,RDK S100的CPU和BPU可支持视觉语义检测模型对人类指令和机器人实时采集的视觉信息高效进行同步处理,同时结合机器人的当前状态,由BPU进行运控推理,完成任务的决策规划。MCU会基于规划结果与BPU实时协同进行运控处理,输出动作指令,精准指引机器人执行拿取杯子的动作。
另外,地瓜机器人CEO王丛提到,具身智能的客户群体大部分要么需要展示机器人的动作控制能力,要么需要打造数据采集工具,百TOPs级算力的RDK S100已经能够满足这些需求,无需过高算力。
目前,地瓜机器人已与超过20+具身智能头部客户建立合作,同时RDK S100已获超过50+客户开展测评,应用于点足机器人、小型双足机器人、半人形机器人、四足机器人、LeRobot机械臂、人形机器人,以及BEV检测、多路视频检测等多种产品。
在发布会现场,也能看到采用了RDK S100应用在宇树G1机器人、睿尔曼机器人以及多款机械臂产品上,正在执行舞蹈表演、物品分拣、复杂地形穿越等任务。
王丛在接受机器人前瞻等媒体采访时谈道,其实地瓜机器人在去年年底就已经研发出RDK S100,不过在正式上市之前,团队花费了半年多时间与多位客户开展前期测评工作,持续优化硬件稳定性、实时性、算法结构等多种问题。
在他看来,针对B端市场,企业可以联合客户一起进行开发,但向开发者市场则有很大不同,企业必须保证所有问题都已经解决,准备工作都已做到位,才能将产品推向京东、淘宝等公开渠道,确保用户开箱即可顺畅使用。
另外,在开发者生态建设上,地瓜机器人正在致力构建开放、多元的机器人技术创新平台。目前,其已赋能超200家中小创客,社区已聚集10万余名开发者用户。
王丛对一个理想的机器人开发者社区的构想,以“持续创新”为核心。他觉得,社区不仅要解决开发者的问题,更重要的是能够源源不断涌现全新且丰富有趣的新应用。
目前,地瓜已在B站等平台积累了不少开发者创作案例,但相比于海外的开发者社区生态仍有提升空间。他希望能够让本科生、研究生以及极客群体,都能轻松产出创意成果并乐于主动分享。