交通场景分类的无监督随机森林学习
1. 引言
从微观角度看,交通场景的数量是无限的。但从稍宏观的视角,会发现它们遵循一定的模式,可被归为高度相似的类别。对每个类别的代表场景进行测试,既能确保广泛的覆盖范围,又能减少验证过程的工作量。为了进行相关性评估,需要对交通场景进行记忆和结构化处理,这就要求对大量的传感器数据进行缩减。可以通过一组相关特征来表示交通状况,这些特征随后可用于机器学习算法进行分析。
通常,记录的交通场景训练数据集需要手动标注,以便运行有监督的分类算法。而无监督学习则能在没有训练标签的情况下,识别数据集中的模式。本文主要介绍一种仅依据任意数据源输入对交通场景进行分类的无监督学习方法。
在介绍决策树之前,先引入一些符号:
- 数据集 $\mathcal{D}$ 由 $M$ 个数据点 $\mathbf{x} m \in \mathbb{R}^N$(特征向量)组成。
- 有监督学习需要一个训练数据集,其中每个特征向量 $\mathbf{x}_m$ 都有一个目标向量 $y_m$。假设可能的输出是标量,则有监督学习的数据集定义为 $\mathcal{D}_s = {(\mathbf{x}_1, y_1), \ldots, (\mathbf{x} {M_s}, y_{M_s})}$。
- 无监督学习的数据集不提供目标值信息,定义为 $\mathcal{D} u = {\mathbf{x}_1, \ldots, \mathbf{x} {M_u}}$。
特征向量 $\mathbf{x}$ 和目标 $y$ 都是随机变量的实现。有监督机器学习的目标是基于 $\mathcal{D}_s$ 找到一
超级会员免费看
订阅专栏 解锁全文
1180

被折叠的 条评论
为什么被折叠?



