19、常见分类算法详解

最新推荐文章于 2025-12-20 15:05:41 发布

beta5

最新推荐文章于 2025-12-20 15:05:41 发布

阅读量39

点赞数

CC 4.0 BY-SA版权

分类专栏： R语言数据科学精要文章标签：线性判别分析 LDA 逻辑回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/beta5/article/details/152340947

R语言数据科学精要专栏收录该内容

46 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

常见分类算法详解

在数据分类领域，有多种算法可用于解决不同类型的问题。本文将详细介绍线性判别分析（LDA）、逻辑回归、k近邻分类器（KNN）和支持向量机（SVM）这几种常见的分类算法。

1. 线性判别分析（LDA）

线性判别分析（LDA）假设所有类别的协方差矩阵相同，即 $\Sigma_i = \Sigma$。在这种假设下，判别函数是线性的。但如果不做此假设，线性判别函数将变为非线性，因为不同类别的 $x$ 的二次项不再相同，这就引出了二次判别函数：
$\delta_i(x)’ = -\frac{1}{2}\log|\Sigma_i| - \frac{1}{2}(x - \mu_i)^T\Sigma_i^{-1}(x - \mu_i) + \log p_i$
进一步的扩展包括使用高斯混合模型或非参数密度估计，这类方法通常被称为高斯判别分析。

2. 逻辑回归

逻辑回归是广义线性模型（GLMs）的一种，用于处理二元数据，可进行分类任务。它的目标是估计条件概率分布 $p(Y = 1|x)$，由于响应变量是二元的，所以 $p(Y = 0|x) = 1 - p(Y = 1|x)$。

为了更好地理解逻辑回归，我们以纽约米其林指南餐厅数据为例。该数据包含餐厅是否被推荐（“InMichelin”）以及多个协变量，如“Food”、“Decor”、“Service”、“Cost”和“Cuisine”。我们选择“Food”分数作为单一协变量进行分析。

首先，我们根据数据计算推荐餐厅的比例：
$prop(restaurants\ in\ Michelin\ guide| food\ score) = \frac

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。