多元时间模式检索的模式图学习
1. 模式图与有效映射
在多元时间模式检索中,模式图和有效映射是重要的概念。对于某些序列,可能找不到有效的映射。例如,若序列中A没有在B之前出现,就无法找到有效的映射;但如果A在特定区间[6, 9]内为真(而非[10, 15]),则可能会有有效的映射。
关于模式图和有效映射的正式定义,以及判断序列是否与给定模式图匹配的高效算法,这里不详细展开。该算法可以简单地表明是否可能匹配,也能提供关于可能匹配的详细信息。对于图中的每条边e = (u, v),在有效映射的情况下,能得到一组有效位置p(e),即满足节点u在t′ < t时的所有值约束,以及节点v在t′ ≥ t时的所有值约束的位置t的集合。
2. 学习模式图的两阶段方法
为了从标记数据中学习模式图,提出了两阶段方法。
2.1 第一阶段:识别类内共享结构
此阶段的主要目标是找到目标类的关键方面。由于预计从这一步就能得到相当复杂的图,所以不采用频繁序列挖掘算法,因为它们会在枚举大量频繁子图上浪费大量时间,且通常不适合包含缺失项(或约束)。寻找所有实例(属于一个类)共有的模式问题与多序列比对密切相关,而多序列比对是NP完全问题。因此,采用启发式方法,具体分为以下三个步骤:
- 单变量路径 :作为预处理步骤,扫描目标类的所有实例,确定约束成立的(连续)区间。对于每个约束C,确定每个实例的区间最小数量nC。根据这些信息创建第一个模式图:对于每个约束C,创建一条从⊤到⊥的路径,始终以“不关心”节点开始和结束,由nC个存在和不存在节点交替组成。例如,如果约束A至少出现一次,约束B出现两次,得到的图
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



