做散点图:
gscatter函数可以按分类或分组来画离散点,适用于画多个类别的离散样本分布图。
使用方法:
gscatter(x,y,group)
gscatter(x,y,group,clr,sym,siz)
gscatter(x,y,group,clr,sym,siz,doleg)
gscatter(x,y,group,clr,sym,siz,doleg,xnam,ynam)
h = gscatter(...)
函数中,x和y是向量,是该点的x轴和y轴坐标,因为画在二维平面上,所以,如果是多维数据,只能从中选取两特征作为x,y坐标来代表点,或者使用特定的降维投影函数来得到x,y。
group是类别标志或分组向量,对应每一个坐标或样本的类别或分组,可以是多分类样本。
clr是点的颜色字符串序列,如“r”代表红色之类,可以不用,所以不做详细介绍了。
使用案例:
A=magic(6)
group=[1,2,3,3,2,3]
gscatter(A(:,1),A(:,2),group)
统计分析:
先做散点图:
load fisheriris
gscatter(meas(:,1), meas(:,2), species,'rgb','osd');
xlabel('Sepal length');
ylabel('Sepal width');
N = size(meas,1);
分类:
LDA分类:
ldaClass = classify(meas(:,1:2),meas(:,1:2),species);
朴素贝叶斯分类:
nbGau= NaiveBayes.fit(meas(:,1:2), species);
nbGauClass= nbGau.predict(meas(:,1:2));
bad = ~strcmp(nbGauClass,species);
nbGauResubErr = sum(bad) / N
nbGauClassFun = @(xtrain,ytrain,xtest)...
(predict(NaiveBayes.fit(xtrain,ytrain), xtest));
nbGauCVErr = crossval('mcr',meas(:,1:2),species,...
'predfun', nbGauClassFun,'partition',cp)
其中strcmp()函数表示:
% 将结构体(x)的字段(s)的类名与字符串(‘maplesym’)比较 % 相等返回 1 % 不相等返回 0~表示否定。
...表示换行。
@表示要调用函数,这里类似数学公式nbGauClassFun(xtrain,ytrain,xtest)=predict(NaiveBayes.fit(xtrain,ytrain), xtest)