端到端自动驾驶综述
这样才会对世界有一个判断和预测;‒ 我理解这里的独立同分布指的就是训练的时候, 数据集中的{(s, a)} 是以相同的概率被采样的.即一个状态对应着一个action;比如训练的时候见到的都是路口停车等待的情况, 那如果测试的时候, 路口一辆车都没有, 哪怕是绿灯, 模型可能都不知道是要往前走的;举一个例子, 拿侧方停车为例, 教练就是专家, 教练会根据观测(看后视镜),产生他自己对于环境的理解(BEV), 通过他自己的经验, 做出具体的判断;但是模块化设计的时候, 不知道什么样的任务是好的,
原创
2023-08-31 22:32:07 ·
1423 阅读 ·
0 评论