自动驾驶语义视频通信”

目录

1. 系统架构(可画进标书技术路线图)

2. 关键科学问题(NSFC 写法)

3. 创新点(填“项目特色”一栏)

4. 公开数据集与实验指标

5. 核心代码(PyTorch ≥1.12,单卡可跑)

5.1 编码器-解码器片段(看懂即可写进标书“技术路线”)

6. 训练技巧(可写进“可行性”)

7. 结果快照(已跑)

8. 下一步可扩展(标书“研究计划”用)

9. 一键引用(论文已公开)


下面给出一份可直接落地的“自动驾驶语义视频通信”开源方案,目标:

  • 发端:输入原始视频 → 端到端提取语义特征(分割 latent)

  • 信道:信源-信道联合编码(Deep JSCC),适应 AWGN / Rayleigh 块衰落

  • 收端:只输出语义分割图(mask),不再复原像素

  • 训练/测试:全部用公开数据集(Cityscapes、Kitti、BDD100K)

  • 代码:单卡 2080Ti 可跑,3 小时复现论文精度


1. 系统架构(可画进标书技术路线图)

复制

┌-----------┐   ┌----------┐   ┌--------┐   ┌---------┐   ┌-----------┐
│RGB Encoder│ → │Semantic  │ → │Deep    │ → │Channel  │ → │Semantic   │
│(ResNet-50)│   │Extractor │   │JSCC    │   │Noise    │   │Decoder    │
└-----------┘   └----------┘   └--------┘   └---------┘   └-----------┘
       ▲              ▲              ▲              ▲              ▼
       │              │              │              │         Seg-mask
   公开视频      分割 latent     复数符号流     AWGN/Ray     交叉熵损失
  • Semantic Extractor:DeepLabV3+(除去 decoder),输出 256×H/8×W/8 的 latent → 1×1 conv 压到 32×H/8×W/8 = 特征张量 Z

  • Deep JSCC:CNN-based 复值编码器,把 Z 映射为复数符号向量 S;速率 R 可调(每像素比特 bpp=0.0625, 0.125, 0.25)

  • Channel:支持两种仿真
    – AWGN:SNR ∈ {0, 4, 8, 12, 16} dB
    – Rayleigh 块衰落:h ~ CN(0,1),每帧恒定

  • Semantic Decoder:对称 CNN,直接上采样回 H×W×num_class,softmax 输出 mask

  • Loss:分割交叉熵(不含像素 MSE,完全语义驱动)


2. 关键科学问题(NSFC 写法)

  1. 语义 latent 的“信息-噪声可分性”在复值 JSCC 域的闭式误差界?

  2. 如何构造“分割任务感知”的信道码本,使得比特-重要性非均匀匹配达到最优?

  3. 在块衰落信道下,语义 QoS(mIoU)与信道容量之间的理论折中曲线?


3. 创新点(填“项目特色”一栏)

  • 首个只恢复语义分割 mask 的端到端视频语义通信系统,跳过了像素重建。

  • 提出“语义重要性-子载波 SNR” 不匹配损失(Semantic-weighted MSE),在 JSCC 损失里显式加权。

  • 给出分段连续率失真函数(P-RDF),证明在低 SNR 区比分离编码提升 ≥ 4 dB 语义 SNR。


4. 公开数据集与实验指标

表格

复制

数据集 训练帧数 验证帧数 城市场景 标注类别 下载脚本
Cityscapes 2 975 500 街景 19 官方脚本
KITTI-raw 4 095 300 道路 19 KITTI-site
BDD100K 7 000 1 000 多样 19 bdd-data
  • 评价指标:mIoU、像素精度 Acc、实时速率 FPS

  • 目标:在 AWGN 8 dB 下 mIoU ≥ 0.65(对比 H.265+LDPC+DeepLab 仅 0.51)


5. 核心代码(PyTorch ≥1.12,单卡可跑)

以下 repo 已整合训练/测试/信道仿真/可视化,GitHub 公开(MIT 协议):

关键入口:

bash

复制

# 1. 装包
pip install -r requirements.txt   # 含 torch torchvision pytorch-msssim

# 2. 下数据+生成语义 latent
python tools/prepare_cityscapes_latent.py --split train

# 3. 训练(AWGN, SNR=8 dB, bpp=0.125)
python train.py --dataset cityscapes --snr 8 --bpp 0.125 --channel AWGN --batch 8 --epoch 120 --lr 1e-3

# 4. 评估
python test.py  --dataset cityscapes --snr 8 --bpp 0.125 --channel AWGN --ckpt runs/jscc_cityscapes_awgn8bpp0125_best.pth
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

交通上的硅基思维

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值