初始假设
假设X∈Rn×dX \in R^{n \times d}X∈Rn×d,即为nnn个样本,ddd维的矩阵,将每个数据矢量的条目合并,使得XiT=(Xi1,…,Xid)X_i^T = (X_i1, \ldots, X_id)XiT=(Xi1,…,Xid)。 在将这些向量放入数据矩阵之前,我们实际上会减去数据的平均值,即:μ=1n∑i=1nXi=(∑i=1nXi1,…,Xid)T\mu = \frac{1}{n} \sum_{i=1}^n X_i = (\sum_{i=1}^n X_i1, \ldots, X_id)^Tμ=n1i=1∑nXi=(i=1∑nXi1,…,Xid)T
然后用每一列减去μT\mu^TμT,得到零中心向量作为矩阵的行:
X=(X1T−μTX2T−μT…XnT−μT)X = \begin{pmatrix} X_1^T - \mu ^T \\ \\ X_2^T - \mu ^T \\ \ldots \\ \\ X_n^T - \mu ^T \end{pmatrix}X=⎝⎜⎜⎜⎜⎜⎜⎛X1T−μTX2T−μT…XnT−μT⎠⎟⎟⎟⎟⎟⎟