判别分析
- 判别分析是根据所研究的个体的观测指标来推断该个体所属类型的一种统计方法
判 别 方 法 { 距 离 判 别 ( 适 用 于 连 续 性 随 机 变 量 的 判 别 类 ) B a y e s 判 别 ( 适 用 于 假 定 对 研 究 的 对 象 已 经 有 一 定 的 认 识 , 这 种 认 识 常 用 先 验 概 率 来 描 述 ) F i s h e r 判 别 ( 适 用 于 两 总 体 的 均 值 向 量 必 须 有 显 著 的 差 异 ) 判别方法\begin{cases} 距离判别 (适用于连续性随机变量的判别类) \\ Bayes 判别 (适用于假定对研究的对象已经有一定的认识,这种认识常用先验概率来描述)\\ Fisher判别(适用于两总体的均值向量必须有显著的差异) \end{cases} 判别方法⎩⎪⎨⎪⎧距离判别(适用于连续性随机变量的判别类)Bayes判别(适用于假定对研究的对象已经有一定的认识,这种认识常用先验概率来描述)Fisher判别(适用于两总体的均值向量必须有显著的差异) - 距离判别
- Mahalanobis 距离的概念
通常我们定义的距离是 Euclid 距离(简称欧氏距离)。但在统计分析与计算中,Euclid 距离就不适用了。
设 x , y x, y x,y 是从均值为 μ μ μ ,协方差为 Σ Σ Σ 的总体 A A A 中抽取的样本,则总体 A A A 内两点 x x x 与 y y y 的 M a h a l a n o b i s Mahalanobis Mahalanobis 距离(简称马氏距离)定义为
d ( x , y ) = ( x − y ) T ∑ ( x − y ) d(x,y)=\sqrt{\frac{(x-y)^T}{\sum(x-y)}} d(x,y)=∑(x−y)(x−y)T
定义样本 x x x 与总体 A A