许华哲,抓紧时间慢慢等具身的未来......

作者丨许华哲

编辑丨具身智能之心

本文已经得到许华哲博士的授权,未经允许,不得二次转载。

点击下方卡片,关注“具身智能之心”公众号

  >>点击进入→具身智能之心技术交流群

昨天看到了许华哲老师在社交媒体上的分享,关于数据、量产、本体和场景。类似的观点,今年IROS圆桌期间,许博也站在智能第一性原理上,将具身的未来发展方向划分为欲望、先验和经验三个模块。

欲望。在做智能体的时候,无论是物理的还是虚拟的,总觉得现在机器学习没有自己的学习欲望。我们可以设想一下,能不能给机器人一种自己的欲望?

先验。预训练的模型让它有了很好的先验。为什么马生下来5分钟就能走路了?也是因为它的DNA里面有一些先验在的。但神经网络没有这样的先验,如何将这种先验移植到神经网络中?这是我经常思考的。

经验。经验是完成世界最终闭环的一种手段。有一天,在家里面看到一位维修师傅就是帮我们修煤气灶,他踩在一个梯子上拧一个东西,整个身体造型极为扭曲,但他仍可以完美控制重心保持平衡,并且手上还可以做非常精细的操作。

这种思想也贯穿在后续的研发和学术探索上。

回想起几年前,我们还在讨论机器人什么时候能全地形走路,后来发现这个话题变成了“跑酷”、“跳舞”、“篮球”。这个变化速率让我知道这个事儿已经成了,如果明年可以攀岩我并不吃惊。

但这极快的变化速率又显得格外不协调,因为我没在任何地方看到人形机器人真正服务人类。快递分拣平均速率是1800件每小时,汽车工厂要万分之一甚至十万分之一的失误率。达成的那一天似乎一直在一个不远不近的地方招手:隔三差五有人宣称任务已经解决,但和跳舞的同行不同,我们只能在视频里见到它。

达到实时性、准确性、5w公里接管,自驾用了10几年,而具身还需要继续努力。

就像前面说的速率上的不协调,回望2025的具身智能,我发现了好几个这样不协调的相互映照的“对子”。当然也有个人的主观臆断,所以也请担待冒失的地方。

一、两个世界的机器梦

从22年、23年同步出发,我们和大洋彼岸几乎同步启航了具身智能的事业。但是到了2025年,我们看到了一个比较明显的分野,中国的公司花更多的力气搞量产、美国公司则展示AI技术上限。

我看到Generalist的Gen0精细的操作,看到Sunday的长程任务能力,看到pi0.6的持续工作能力,内心是有焦虑的。我有一个不好的直觉,我们要评估我们的技术是不是落后,但我想这里,我有责任,学术界的其他人也都有责任。量产重不重要,非常重要,但是机器人不是汽车,需要AI能力来领跑。

我觉得我们要适应一件事,就是时代变了。在过往的技术上,我们采用跟随策略;在大模型上我们已经产生了DeepSeek这样的原始创新;在具身智能上,我们应该有信心也有概率,最大的那件事儿发生在中国。我在https://zhuanlan.zhihu.com/p/683671286 中也有讨论过:“简单说你用修长城的场,不管给多少人、多少机器、多少钱该干不出来还是干不出来,该撵不上就还是撵不上”。我理解努力做确定性有收益的事情的那种爽感:我努力、我成长、我收获。但是我想我们真正缺乏的还是:我努力、我失败了99次、但我吸取教训并且期待第100次也许会成功。在一些人“成功地”蒸馏别人的模型时,另一些人在“失败地”研制新的算法。

我认为商业化很重要,也深知量产的严肃性,我只是怕我们错过了最大的那个西瓜。

二、落地简单场景还是挑战困难场景

这阵子也有看过一些场景,各种各样的工厂。我有一个稍有一点悲观的暂时性结论:高价值高重复的场景,总会出现一个深圳或者无锡的聪明人,造出一套自动化设备解决90%的问题。这个结论的反面是——目前没有自动化的事情,往往要么单价不高,要么重复度不高。因此,我反而觉得具身智能相比于传统的工业机器人更像是大模型。

让我们沿着这一类比去想,就像大模型不应该花时间在“情感理解”,“文章摘要”这样的任务上一样,具身智能就不应该做这些简单地任务,而是应该去挑战“强操作”、“高泛化”的事情。这样我们也更能期待一个高质量的模型,通用地解决许多事情。

当然,我们不能否定现有落地的价值,因为很多向具体场景的落地无论未来的智能模型有多强,都还是需要比较高的迁移成本的,这个路早趟过去也是好的。

三、“预训练”配合“先验学习”

具身智能的数据瓶颈天然存在,仿真数据不足、真机数据的缺乏,会逐渐解决但也会持续存在。因此,具身智能恐怕不能先穷尽预训练数据,再走向模型探索,而是需要螺旋上升式地进行探索。因此未来我们可能会看到,一个预训练好的模型,用强化学习在一些任务上变得拥有超越人类的能力;而这个模型可能又会在未来更多的数据上——包括增采的和真机探索的——训练得更好。

同样的逻辑,也适用于世界模型,我从不相信我们能够从人类采集好的数据里面训练出一个足够好的世界模型,相反,我们需要机器人真正地自主与世界交互,才能找到真正属于自己的世界模型。我还一直有一个很感兴趣的话题,用一套强化学习目标函数来完成预训练和后训练,但这是来年的事情了。

所有的成长,都是挣扎着向上。

具身智能的2025年,没有一步登天,但是确实越来越强烈地感受到一种未来在召唤。突然想起了前阵子和小龙的一次闲聊。“但也没感觉很遥远了” “确实,不算太远了” “It’s an exciting time. Just needs execution.”是我们对话的结束。

最后想送给所有梦想着让机器人帮助所有人的朋友,一句《马大帅》里的话:“让我们抓紧时间慢慢等吧”。

本文只做学术分享,如有侵权,联系删文

<think> 嗯,用户的问题是关于如何调整机器人研究项目和论文写作的,结合之前的讨论和引用内容来看,用户似乎处于学术转型或研究方向规划阶段。从引用[2]提到的顶级会议和引用[3]的产业化要求来看,用户可能面临学术价值与工程落地的平衡问题。 用户引用的内容透露出几个关键点:一是美团案例强调场景落地的重要性(引用[1]),二是顶级研究机构注重前沿会议发表(引用[2]),三是工业界需要技术转化能力(引用[3])。这提示回答需要覆盖从实验室到产业化的完整链条。 在专业层面,需要强调三个维度:首先是技术深度,比如之前提到的多机器人共识算法里动态负载阈值$L_{\text{th}} = k \cdot \frac{C_{\text{total}}}{N_{\text{active}}}$公式的严谨性;其次是场景适配,像农业无人机植保市场占比43%(引用[4])这类数据支撑;最后是方法论,例如如何将项目拆解为可发表的模块。 注意到用户特别询问“调整”,可能隐含现有项目转化论文的困惑。针对这点,建议从论文写作反推项目设计:比如做传感器融合时,要有意识采集时间戳误差$\Delta t$的原始数据,为后续$$ \sigma_t = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(\Delta t_i - \mu_t)^2} $$这种量化分析留好伏笔。 安全问题要格外提醒,引用[3]提到大模型项目经理要“确保技术成果转化”,对应到机器人领域就是避免实验室算法在实际场景失效。之前的方向五虽然提到安全验证,但还需补充像ISO 13849这类工业标准适配性分析。 </think> 根据您的研究目标及行业发展趋势,结合机器人领域科研与产业化的双重要求,以下提供项目调整与论文写作的进阶策略,并融入关键引用文献: --- ### 一、项目调整策略——聚焦“技术-场景”闭环 1. **场景驱动技术革新** - 参考美团在低空经济的实践[^1],将项目与农业植保(占比43%[^4])、仓储物流等商业化成熟场景深度绑定 - **调整示例**: ```markdown 原方案:通用多机器人路径规划 新方案:*植保无人机集群的农药喷洒覆盖率优化* - 引入风场模型:$v_{\text{wind}}(x,y,t)$ - 设计抗扰动的分布式控制律:$u_i = k_p \sum_{j \in N_i} (p_j - p_i) + k_v (v_d - v_i)$ ``` 2. **构建“科研-产业”协作链** - 吸收引用[3]中“跨部门对接科研成果转化”的经验,早期引入企业需求方 - **实践路径**: ```mermaid graph LR A[高校算法创新] --> B(企业场景数据) B --> C{联合验证平台} C --> D[专利/论文] C --> E[产品解决方案] ``` --- ### 二、论文写作进阶——瞄准顶级会议/期刊 #### (1) 理论创新层(参考清华许华哲组标准[^2]) - **核心公式需可扩展性** 例如将传统SLAM问题建模为: $$ \mathop{\text{argmin}}_{\mathbf{x}, \mathbf{m}} \sum_{k} \Vert z_k - h_k(\mathbf{x}, \mathbf{m}) \Vert_{\Sigma_k}^2 + \sum_{ij} \Vert e_{ij}(\mathbf{x}) \Vert_{\Omega_{ij}}^2 $$ 衍生出*动态场景自适应因子*等创新点 - **实验对比需超越SOTA 15%+** 如路径规划算法在*标准测试环境*达到: | 算法 | 路径长度(m) | 计算耗时(ms) | |---|---| --- | | RRT* | 42.3 | 820 | | **Ours** | **36.1** | **590** | #### (2) 工程价值层(呼应引用[1][^3]) - **引入技术成熟度评估** 构建TRL(Technology Readiness Level)量表: ``` Level 5:实验室环境验证 → Level 7:工业现场原型机 ``` - **量化经济效益** 例如:“通过边缘计算框架降低37%能耗,按10,000台物流机器人规模测算,年省电费约$2.1M” --- ### 三、热点方向嫁接建议 | 原始方向 | 融合热点 | 创新产出示例 | |---|---|---| | 多机器人协作 | 大模型决策 | Transformer-based任务分配器 $$ \text{TaskAssign} = \text{Softmax}(\frac{QK^T}{\sqrt{d_k}})V $$ | | 传感器融合 | 神经辐射场(NeRF) | 激光雷达辅助的NeRF地图更新算法 | | 路径规划 | 人类意图预测 | 基于EEG信号$\Psi(\omega)$的交互式避障 | --- ### 四、论文结构优化模板 ```latex \section{方法论} \subsection{问题定义} 考虑有$n$个智能体的系统:$\mathcal{S} = \{ \langle q_i, v_i \rangle \mid i=1,...,n \}$ \subsection{核心算法} \begin{algorithm} \For{每个决策周期$\Delta t$} 采样环境状态$s_t \sim \mathcal{E}$ \\ 计算策略$\pi_{\theta}(a_t|s_t)$ \tcp*{嵌入安全约束$\Gamma_{\text{safe}}$} \end{algorithm} \section{工业验证} 部署于美团XX仓库[^1],冲突率从12%→3%($p<0.01$) ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值