- 博客(4)
- 收藏
- 关注
原创 简谈自动驾驶与各大车企的核心战略
车企路线归类关键架构/说明特斯拉端到端 (End-to-End)最坚定的“纯视觉+端到端”路线执行者。其FSD V12被认为是行业内首个大规模应用的“端到端”模型,输入为摄像头视频,输出为驾驶指令。小鹏端到端 (End-to-End)非常明确的“端到端大模型”战略。其“图灵AI智驾系统” 和VLA(视觉-语言-行动)模型均基于此架构,旨在实现“车位到车位”的全场景覆盖。理想从"模块化"转向"端到端"理想清晰地展示了其进化路径:第一阶段(2021年起)依赖“规则算法”(模块化);
2025-11-05 19:16:54
783
原创 视觉语言导航(VLN)简介
VLN 是的缩写,即视觉语言导航。任务是让智能体(机器人、无人机等)根据自然语言指令,利用视觉感知,自主规划路径并到达目标位置。自然语言指令 I: 一个描述目标位置或路径的文本序列。环境观测 O: 在每个时间步 t,智能体接收到的视觉信息,通常是第一人称视角的图像- (RGB图像,有时也包括深度图或全景图)。动作序列 A = {a_1, a_2, …, a_T}: 智能体执行的一系列动作,动作空间通常是离散的(例如:FORWARD, TURN_LEFT, TURN_RIGHT, STOP)。
2025-08-10 19:21:58
682
原创 面向真实环境的无人机视觉语言导航,平台、基准与方法论文阅读笔记
VLN的大多数研究都集中在地面上,而基于无人机的VLN仍然相对未被充分探索。目前,无人机视觉语言导航主要采用基于地面的VLN设置,依赖于预定义的离散动作空间,而忽略了智能体运动动力学的内在差异以及地面和空中环境之间导航任务的复杂性。为了解决这些差异和挑战,作者从三个角度提出了解决方案:平台、基准和方法论。平台:提出了开放无人机平台OpenUAV,该平台具有多样化的环境,逼真的飞行控制和广泛的算法支持。
2025-08-10 19:19:53
1198
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅