数据模式分析与矩阵排列方法解析
1. 模式分析概述
模式分析通常是指在图片和位图中寻找模式和结构。这里我们将进一步探讨,假设对一个位图中的像素进行打乱,能否将其重新排列以发现其中的模式呢?我们主要关注一种名为热图的特定显示方式。热图并非新事物,早在1957年,Sneath就建议通过层次聚类对相似性矩阵的行/列进行排序,并根据相似性对数值进行着色;1967年,Bertin使用明暗值来突出数据矩阵中的Guttman尺度模式;1973年,Ling使用着色来突出相关矩阵和数据矩阵中的数值结构。自20世纪80年代初以来,BMDP和SYSTAT在其聚类模块中就包含了热图矩阵显示。1981年,Gower和Digby展示了各种置换矩阵显示。
2. 矩阵置换
假设我们有一个数据矩阵,希望对其行和列进行置换。为此,我们定义行和列置换矩阵,例如:
*
$
&$
0%
5
0%
B
0%
&$
$
5
$
B
$
/%
0$ %
;(
/$$%
*
$$ $
&
"
0
&
"
0
0
X
a b c
d e f
g h i
j k l
=
然后应用乘积操作。需要注意的是,置换矩阵P是可组合的,所以我们可以将置换作为一系列变换来执行。
要对数据矩阵进行置换,我们需要一个目标函数来确定行和列置换矩阵。一个普遍的要求可能是进行置换,使得数据矩阵中相似的值彼此靠近,并且相似值的区域尽可能少。然而,这个要求过于宽泛,实现它会是一个NP难题,因为我们必须检查每一种可能的置换,并寻找能产生最佳结果的
超级会员免费看
订阅专栏 解锁全文
787

被折叠的 条评论
为什么被折叠?



