足球模拟中基于实例的对手动作预测
在足球模拟等实时应用领域,基于实例的学习算法在处理数据密集型任务时,检索时间可能成为系统瓶颈。为解决这一问题,本文介绍了边界图(Boundary Graphs,BG)方法,并与经典的最近邻算法和边界森林(Boundary Forest,BF)方法进行了对比。
1. 高效检索的索引结构相关工作
基于实例的方法中的索引结构旨在更有效地引导对相似实例的搜索。在使用索引结构进行实际检索之前,必须先创建该结构。树型结构常被用于加速对大型数据集的访问,例如几何近邻访问树、最近向量树等。具有在线插入功能的树型算法包括覆盖树、边界树和 kd - 树,其中 kd - 树的优势在于不需要在树节点进行完整的距离计算。
1.1 边界树
边界树是一种强大的基于距离搜索的树型索引结构。它由代表训练实例的节点通过边连接而成,使得每对父子节点属于不同的类别。给定一个边界树 T 和一个新查询 q,从根节点开始遍历树,计算 q 与当前节点所有子节点的距离,然后移动到与 q 距离最小的子节点并继续遍历。边界树使用参数 k ∈[1, ∞] 来确定任何节点允许的最大子节点数。当到达叶子节点,或者当前(内部)节点 v 的子节点少于 k 且 q 与 v 的距离小于 q 与 v 所有子节点的距离时,检索结束,找到与查询“局部最近”的实例 x∗。
边界树的创建过程受经典的 IB2 算法启发。将下一个训练实例 xi 作为查询,使用现有的边界树 Ti−1 进行检索。如果基于树的检索结果返回的实例 x∗ 的类别标签与 xi 的类别标签不匹配,则将 xi 作为 x∗ 的新子节点添加到树中。
1.2 边界森林
Mathy 等人提出将边
超级会员免费看
订阅专栏 解锁全文
1871

被折叠的 条评论
为什么被折叠?



