目录
————————————————一、环境感知(自动驾驶实时场景理解)
————————————————二、车位占用检测与流量分析(停车场/路侧场景)
0 背景和意义
• 交通安全:WHO 统计 94% 严重交通事故由人为失误导致,全天候、全工况的 CV 感知是自动驾驶安全落地的“最后一公里”。
• 城市治理:停车难造成 30% 城市拥堵、20% 额外碳排;低成本、可大规模复制的车位状态感知是城市级“碳达峰/碳中和”指标的关键抓手。
• 商业闭环:Robotaxi 需要高精感知降低单车接管率;商业地产需要实时空位数据提升车位周转率→直接带来租金/广告增值。
研究现状(时间轴速览)
表格
复制
| 阶段 | 代表工作 | 关键进展 | 传感器范式 |
|---|---|---|---|
| 2012–2015 | R-CNN, OverFeat | 2D检测起步 | 单目视觉 |
| 2016–2018 | YOLOv2, Faster-RCNN, VoxelNet | 3D检测萌芽 | LiDAR+单目 |
| 2019–2020 | PointPillars, CenterPoint | 纯LiDAR 3D SOTA | 64/128线 |
| 2021 | BEVDet, BEVFormer | 视觉BEV统一表达 | 环视相机 |
| 2022 | BEVFusion, PETR v2 | 多模态BEV融合 | 视觉+LiDAR |
| 2023–2024 | Occupancy Networks, UniAD | 端到端规划感知 | 全模态 |
车位占用检测
• 传统:地磁/超声波(2015 前)→ 单相机+背景差分(2016–2018)→ 实例分割+跟踪(2019–)。
• 2023 年起:BEV+多相机跨车位关联(如 ParkBEV, Alibaba DAMO)。
————————————————
3. 仍未解决的共性问题 & 可行方案
表格
复制
| 问题 | 具体表现 | 攻关路线 |
|---|---|---|
| 极端天气/光照 | 夜间眩光、暴雪点云稀疏 | ① 事件相机+RGB融合;② 基于物理的雨雪点云补全网络(LiSnowNet);③ 自监督域适应 |
| 数据长尾 & 标注成本 | 异形工程车、宠物狗、无牌三轮车样本稀少 | ① NeRF+扩散模型合成(BEVGen);② 主动学习挑帧标注;③ 弱监督:利用闸机/地磁真值自动生成标签 |
| 多模态同步 & 时延 | 相机-LiDAR 微秒级同步困难,BEV 融合延迟>80 ms | ① PTP硬件时钟同步;② 事件驱动异步融合(AsynBEV);③ INT8 量化 + TensorRT 插件 |
| 车位级细粒度误检 | 阴影、相邻车开门、SUV/小车尺度差异 | ① 引入车位几何先验(HDMap车位角点)作为Attention Mask;② 多任务:检测+分割+深度联合优化 |
| 边缘算力受限 | Jetson Nano 跑 8 路 1080p 仅 5 FPS | ① 知识蒸馏:大模型→轻量RepVGG;② Frame-skipping + 光流插帧;③ 专用NPU(地平线BPU) |
把“环境感知”与“车位占用检测/流量分析”这两件事拆开,按“感知任务 → 传感器与数据 → 算法链路 → 工程落地 → 性能指标 → 典型案例”六个维度给出一份可直接落地的详细说明。
————————————————
一、环境感知(自动驾驶实时场景理解)
-
感知任务
• 动态目标:行人、骑行者、机动车、异形障碍(掉落的箱子、动物)。
• 静态目标:车道线(实线/虚线/可变车道)、交通标志(限速/禁停/让行)、红绿灯、路沿、可行驶区域。
• 语义属性:目标朝向、速度、轨迹预测、遮挡关系。 -
传感器与数据
• 视觉:8 MP@30 fps前向+环视鱼眼,HDR+低照度增强;时间同步<1 ms。
• 激光雷达:64/128线,0.1 m@100 m,360°水平FOV;点云密度≈200 k pts/s。
• 毫米波:77 GHz,250 m有效,雨雪穿透;与视觉硬同步。
• 高精地图:车道级几何、交通标志先验,在线与感知结果做差分校验。 -
算法链路(以BEV为中心的多模态框架)
• 输入对齐:
– 图像→IPM/Transformer 做BEV视角投影;
– 点云→体素化或Range View;
– 毫米波→稀疏点云+多普勒速度通道。
• 主干网络:
–

最低0.47元/天 解锁文章
1562

被折叠的 条评论
为什么被折叠?



