数据处理与分析:块边界检测及地理信息推断
在数据处理与分析领域,有两个重要的研究方向值得关注,一是块式常量矩阵中块边界的快速检测,二是利用非代表性数据推断被审查的地理信息。下面将详细介绍这两个方面的研究内容。
块式常量矩阵中块边界的快速检测
在处理受噪声干扰的块式常量矩阵时,研究人员提出了一种将问题转化为变量选择问题的新方法。该方法具有高效性和低计算负担的特点,适用于处理来自分子生物学的大规模数据集。
- 阈值对变化点估计的影响
- 研究发现,当阈值(thresh)在[20, 40]区间内时,即使在高噪声水平的情况下,变化点的数量和位置也能得到很好的估计。
- 不同的σ值会影响每个估计变化点的得分,真实的变化点位置位于行和列的101、201、301和401处。
- 应用于HiC数据
- 将该方法应用于公开可用的小鼠皮质染色体1和19的相互作用矩阵数据。
- 比较了该方法与其他方法在估计变化点的数量和位置上的差异。通过计算行变化点的Hausdorff距离的两部分d1和d2,发现两种方法的分割结果存在一些差异,但当估计的变化点数量相同时,块的边界非常接近。
- 例如,当thresh = 1.8%(左)和10%(右)时,两种方法的变化点位置有很多相似之处。
- 方法优势
- 与其他方法相比,该方法的计算负担极低,为处
超级会员免费看
订阅专栏 解锁全文
661

被折叠的 条评论
为什么被折叠?



