一.概述
典型相关分析研究的是两组变量之间的相关关系。我们借用PCA降维的思想,先从两组变量中分别提取主成分u和v,然后u和v的相关程度达到最大,这样就把研究两组变量之间的相关问题转化为研究两个变量u和v之间的相关问题。
设x=(x1,x2,...,xp)'和y=(y1,y2,...yp)'是两组随机变量
典型相关分析需要研究x的线性函数u=a'x与y的线性函数v=b'y之间的相关关系,使ρ(u,v)达到最大
求解得到的a1和b1使ρ(u,v)达到最大值ρ1,我们称u1=a'x ,v1=b'y为第一对典型相关变量,称ρ1为第一个典型相关系数
二.SAS实现
proc cancorr data=tmp1.innovation out=a outstat=a1 all vdep; #all选项输出典型冗余分析的结果,vdep表示以var变量为因变量,with变量为自变量
进行多元回归分析
with Patent NEWP PTMVALUE HIGHEXPORT; #列出被分析变量两组中的第二组
var RRDINSTi RDINTENSITY PRDEX PRDP;