Hierarchical Vector Quantized Transformer for Multi-class Unsupervised Anomaly Detection 理解的创新:将中间的连续空间变换,换成了离散的信息传递,或者将单一的离散传递 变成了 多个层级的信息传递。 疑问: 其中不太理解的是其中的最优传输POT的意义?