序
在上一节的优快云中,粗糙的学习了一下“散点——协方差矩阵——特征向量——轴”的过程。
# 计算以下数据的协方差矩阵
import numpy as np
import matplotlib.pyplot as plt
# np.random.seed(0)#随机数种子
# data = np.random.uniform(1,10,(10,2))
# data[:,1:] = 0.5*data[:,0:1]+np.random.uniform(-2,2,(10,1))
#不用随机数了,这次用一个比较实际的例子,来测试PCA准不准
#假设这是一个扁扁的矩形
input=list()
input.append([100,100])
input.append([500,100])
input.append([100,200])
input.append([500,200])
print(input)
#从已有的数组创建数组
data=np.asarray(input)
print(data)
#去中心化
data_norm = data-data.mean(axis = 0)#axis = 0:压缩行,对各列求均值,返回 1* n 矩阵
X = data_norm[:,0]
Y = data_norm[:,1]
C=np.cov(data_norm,rowvar=False)## 此时列为变量计算方式 即X为列,Y也为列
#计算特征值和特征向量
#这个返回的特征向量,要按列来看
vals, vecs = np.linalg.eig(C)
#重新排序,从大到小
#默认从小到大排列,这里取负了,就是从大到小排列,返回相应索引
vecs = vecs[:,np.argsort(-vals)]#特征向量按列取,这里就呼应上了
vals = vals[np.argsort(-vals)]
print(vals)
print(vecs)
#第一个特征值对应的特征向量
print(vals[0],vecs[:,0])
#第二个特征值对应的特征向量
print(vals[1],vecs[:,1])
#计算模长是否为1
print(np.linalg.norm(vecs[:,0]))
print(np.linalg.norm(vecs[:,1]))
#用画图的方式,画出结果
#设置图大小
size = 600
plt.figure(1,(8,8))
plt.scatter(data[:,0],data[:,1],label='origin data')
i=0
ev = np.array([vecs[:,i]*-1,vecs[:,i]])*size
ev = (ev+data.mean(0))
plt.plot(ev[:,0],ev[:,1],label = 'eigen vector '+str(i+1))
i=1
ev = np.array([vecs[:,i]*-1,vecs[:,i]])*size
ev = (ev+data.mean(0))
plt.plot(ev[:,0],ev[:,1],label = 'eigen vector '+str(i+1))
#plt.plot(vecs[:,1]*-10,vecs[:,1]*10)
#画一下x轴y轴
plt.plot([-size,size],[0,0],c='black')
plt.plot([0,0],[-size,size],c='black')
plt.xlim(-size,size)
plt.ylim(-size,size)
plt.legend()
plt.show()

这个仅仅是求出了两个轴,是一点进步,但是还不够。因为真正有用的,是OBB包围盒。那末,怎么用PCA方法计算OBB包围盒呢?
OBB包围盒的计算
理论基础


概括的说,就是,把原基下的坐标转化到新基下,以新基为参照,计算新基下的AABB包围盒,然后再把新基转化为原基,就得到了原基下的obb包围盒。
新基下的AABB包围盒,就是原基下的OBB包围盒。
这里面的主要矛盾是——矩阵乘法与基变换。解决了这个,其它的次要矛盾,就能迎刃而解。
矩阵乘法,也叫基变换,左行右列?到底左乘还是右乘?点的坐标到底是横着写还是竖着写?有点迷糊……而数学是精确的一门学科,一点也马虎不得。
有问题的地方就有矛盾嘛,不同质的矛盾要用不同质的方法去解决,这个矛盾,应该用复习线性代数的方法去解决。


代码实现的摸索
第一段-别人的
OBB包围盒,这个主轴,对应的是方差最大的意思
特征向量,有方向。两个主轴。
涉及到一个投影的问题……
投影怎么算?这个是上一节里没涉及到的部分了。
还到这个链接里去找一找吧,希望能找到方法。猜一下,投影,矩阵乘法,基变换;应该和这些有关。具体怎么写?怎么用?都是问题,都是矛盾。
还是这个链接
简单的说,在之前的求特征值和画轴之间,加个这个,就求投影了。
作为一个0基础小白,就知道它大概是在矩阵乘法,然后正交矩阵的逆矩阵和转置相等。
总觉得这个左乘右乘和想的不大一样……
再就不会了,小白嘛,不会才是常态。
##########新加的,求投影的一段################################################
#数据在主成分1上的投影坐标是Y
k=1
Q = vecs[:,:k]
Y = np.matmul(data_norm,Q)
#得到去中心化的还原数据
np.matmul(Y,Q.T)
#加上均值,还原数据
data_ = np.matmul(Y,Q.T)+data.mean(0)
#########################################################
全部的:
# 计算以下数据的协方差矩阵
import numpy as np
import matplotlib.pyplot as plt#Pyplot 是 Matplotlib 的子库,提供了和 MATLAB 类似的绘图 API。
#不用随机数了,这次用一个比较实际的例子,来测试PCA准不准
#假设这是一个扁扁的矩形,输入散点数据
input=list()
input.append([100,100])
input.append([500,100])
input.append([200,200])
input.append([400,200])
print(input)
#从已有的数组创建数组
data=np.asarray(input)
print(data)
#去中心化
data_norm = data-data.mean(axis = 0)#axis = 0:压缩行,对各列求均值,返回 1* n 矩阵
X = data_norm[:,0]
Y = data_norm[:,1]
C=np.cov(data_norm,rowvar=False)## 此时列为变量计算方式 即X为列,Y也为列
#计算特征值和特征向量
#这个返回的特征向量,要按列来看——因为,矩阵乘法来变换坐标系的时候,新基就是竖着的嘛
vals, vecs = np.linalg.eig(C)
#重新排序,从大到小
#默认从小到大排列,这里取负了,就是从大到小排列,返回相应索引
vecs = vecs[:,np.argsort(-vals)]#特征向量按列取,这里就呼应上了
vals = vals[np.argsort(-vals)]
print(vals)
print(vecs)
#第一个特征值对应的特征向量
print(vals[0],vecs[:,0])
#第二个特征值对应的特征向量
print(vals[1],vecs[:,1])
#计算模长是否为1
print(np.linalg.norm(vecs[:,0]))
print(np.linalg.norm(vecs[:,1]))
##########新加的,求投影的一段##############################

本文探讨了如何使用PCA计算数据的主成分,并将其应用于计算OBB包围盒。作者逐步解析了基变换的原理,从求协方差矩阵、特征值到投影,最终实现OBB的坐标转换。
https://gitee.com/ni1o1/pygeo-tutorial/blob/master/12-.ipynb
最低0.47元/天 解锁文章
705

被折叠的 条评论
为什么被折叠?



