块常量矩阵中块边界的快速检测
在许多实际应用中,自动检测受噪声干扰的块常量矩阵中的块边界是一个重要问题。例如,在分子生物学中,HiC技术提供的数据可以表示为一个矩阵,检测该矩阵的块边界有助于识别染色体上相互作用的区域,从而更好地理解染色体构象对细胞功能的影响。
1. 背景与问题提出
对于一维数据的变点检测问题,已有大量研究。常见的离线方法基于动态规划算法,但其时间复杂度为 $O(Kn^2)$,对于大规模数据集来说计算成本过高。后来有人将变点估计问题转化为变量选择问题,还有人将其扩展到寻找多个信号之间的共享变点。然而,对于二维数据(行数和列数可能非常大,如 $n × n ≈ 5000 × 5000$)的变点检测,目前可用的方法较少。
2. 统计框架
2.1 统计建模
我们的目标是从随机矩阵 $Y = (Y_{i,j}) {1\leq i,j\leq n}$ 中估计 $t_1^\star = (t {1,1}^\star, \cdots, t_{1,K_1^\star}^\star)$ 和 $t_2^\star = (t_{2,1}^\star, \cdots, t_{2,K_2^\star}^\star)$。其中,$Y$ 定义为 $Y = U + E$,$U = (U_{i,j})$ 是一个块常量矩阵,$E = (E_{i,j})$ 是零均值的独立同分布随机变量矩阵。
通过一系列变换,我们可以将模型 $Y = U + E$ 重写为稀疏高维线性模型 $Y = XB + E$,其中 $Y = Vec(Y)$,$X = T \otimes T$,$B = Vec(B)$,$E = Vec(E)$。这
超级会员免费看
订阅专栏 解锁全文
1197

被折叠的 条评论
为什么被折叠?



