高斯判别分析matlab实现

本文介绍了一种基于高斯判别分析(GDA)的机器学习模型,并提供了其在MATLAB上的实现代码。通过将GDA应用于UCI乳腺癌数据集,使用20%的数据作为训练集,模型达到了0.95的准确率。文中详细阐述了GDA参数求解、高斯函数计算概率密度值及预测函数的实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文基于博客https://blog.youkuaiyun.com/kwame211/article/details/81530766一文,将其改为matlab上的实现。高斯判别分析的推导过程可参见https://zhuanlan.zhihu.com/p/38269530一文。

函数1:GDA参数求解

// GDA参数求解
function [ fi, u_pos, u_neg, sigma ] = GDA( x,y )
% 高斯判别分析模型的参数估计
% x为样本特征,y为样本类别
m=size(x,1);% 记录样本总数
x_pos=[];% 样本正例
x_neg=[];% 样本负例
y_pos=[];
y_neg=[];
for i=1:size(x,1)
    if y(i)==1
        x_pos=[x_pos;x(i,:)];
        y_pos=[y_pos;y(i)];
    else 
        x_neg=[x_neg;x(i,:)];
        y_neg=[y_neg;y(i)];
    end
end      
fi=size(y_pos,1)/m;  %计算fi,即样本中正例所占的比例
u_pos=sum(x_pos,1)./(size(y_pos,1));% 计算u1
u_neg=sum(x_neg,1)./(size(y_neg,1));% 计算u0
xx=[];
for i=1:m
   if y(i)==1
       xx=[xx;x(i,:)-u_pos];
   else
       xx=[xx;x(i,:)-u_neg];
   end  
end
sigma=(xx'*xx)./m;    
end

函数2:高斯函数

function [ prob ] = Gaussian( x,mean,cov )
% 计算输入x的概率密度值
diff=x-mean;
n=size(x,2);
cov=cov+0.001;%保证矩阵行列式非零
prob=exp((diff*inv(cov)*diff')/(-2))/(((2*pi).^(n/2)).*(abs(det(cov))).^0.5);
end

函数3:预测

function [ y_pred, accuracy ] = predict( x,y,u_pos,u_neg, sigma )
% 类别判断
for i=1:size(x,1)
    x_pos=Gaussian(x(i,:),u_pos,sigma);
    x_neg=Gaussian(x(i,:),u_neg,sigma);
    if x_pos>x_neg
        y_pred(i)=1;
    else
        y_pred(i)=0;
    end
end
    accuracy=sum(y-y_pred'==0)/size(y,1);
end

主函数

[ fi, u_pos, u_neg, sigma ] = GDA( x_train,y_train );
[ y_pred, accuracy ] = predict( x_test,y_test,u_pos,u_neg, sigma );

应用于UCI乳腺癌数据集,以20%的数据作为训练集,精度可达0.95

在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值