模式识别期末复习题集 第四章 非参数判别分类方法(包含详细解题步骤,重要概念解释)

模式识别

目录

第一章 绪论
第二章 贝叶斯决策理论
第三章 概率密度函数的参数估计
第四章 非参数判别分类方法
第五章 聚类分析
第六章 特征提取与选择

  • 本系列博客包含2,3,4,5,6章的内容

引言

这是我期末复习时候整理的笔记。我会把每一章单独发一篇博客,都搞到一起无法发布,提示字数太多没办法了。

  • 教材:模式识别及MATLAB实现
  • ISBN: 978-7-121-32127-6
    在这里插入图片描述

第四章 非参数判别分类方法

题目 1

设一3类问题有如下判决函数:

d 1 ( X ) = − x 1 d_1(X) = -x_1 d1(X)=x1

d 2 ( X ) = x 1 + x 2 − 1 d_2(X) = x_1 + x_2 - 1 d2(X)=x1+x21

d 3 ( X ) = x 1 − x 2 − 1 d_3(X) = x_1 - x_2 - 1 d3(X)=x1x21

试画出下列各种情况的判决边界及各类的区域:

(1) ω i / ω i ‾ \omega_i/\overline{\omega_i} ωi/ωi 两分法;

(2) ω i / ω j \omega_i/\omega_j ωi/ωj 两分法,且令 d 12 ( X ) = d 1 ( X ) d_{12}(X) = d_1(X) d12(X)=d1(X) d 13 ( X ) = d 2 ( X ) d_{13}(X) = d_2(X) d13(X)=d2(X) d 23 ( X ) = d 3 ( X ) d_{23}(X) = d_3(X) d23(X)=d3(X)

(3) 没有不确定区域的 ω i / ω j \omega_i/\omega_j ωi/ωj 两分法。

  • 方法解释:

    1. ω i / ω i ‾ \omega_i/\overline{\omega_i} ωi/ωi 两分法:如果

      { d i ( X ) > 0 d j ( X ) ≤ 0 ( ∀ j ≠ i ) , \begin{cases} d_i(X) > 0 \\ d_j(X) \leq 0 \quad (\forall j \neq i), \end{cases} {di(X)>0dj(X)0(j=i),

      X ∈ ω i ( i = 1 , 2 , … , c ) X \in \omega_i \quad (i = 1,2,\dots,c) Xωi(i=1,2,,c)

    2. ω i / ω j \omega_i/\omega_j ωi/ωj 两分法:如果

      d i j ( X ) > 0 ( ∀ j = 1 , 2 , … , k , j ≠ i ) d_{ij}(X) > 0 \quad (\forall j = 1,2,\dots,k, j \neq i) dij(X)>0(j=1,2,,k,j=i)

      X ∈ ω i X \in \omega_i Xωi

    3. 没有不确定区域的 ω i / ω j \omega_i/\omega_j ωi/ωj 两分法:

      如果

      d i ( X ) > d j ( X ) ( ∀ j = 1 , 2 , … , k , j ≠ i ) , d_i(X) > d_j(X) \quad (\forall j = 1,2,\dots,k, j \neq i), di(X)>dj(X)(j=1,2,,k,j=i),

      X ∈ ω i X \in \omega_i Xωi

答案:

红色区域表示 ω 1 \omega_1 ω1
绿色区域表示 ω 2 \omega_2 ω2
蓝色区域表示 ω 3 \omega_3 ω3

  1. ω i / ω i ‾ \omega_i/\overline{\omega_i} ωi/ωi 两分法

在坐标上,画出 d 1 ( X ) , d 2 ( X ) , d 3 ( X ) d_1(X),d_2(X),d_3(X) d1(X),d2(X),d3(X) ,然后根据 ω i / ω i ‾ \omega_i/\overline{\omega_i} ωi/ωi 两分法:

{ d i ( X ) > 0 d j ( X ) ≤ 0 ( ∀ j ≠ i ) , \begin{cases} d_i(X) > 0 \\ d_j(X) \leq 0 \quad (\forall j \neq i), \end{cases} {di(X)>0dj(X)0(j=i),

X ∈ ω i ( i = 1 , 2 , … , c ) X \in \omega_i \quad (i = 1,2,\dots,c) Xωi(i=1,2,,c)

规则区分区域

在这里插入图片描述

  1. ω i / ω j \omega_i/\omega_j ωi/ωj 两分法,且令 d 12 ( X ) = d 1 ( X ) d_{12}(X) = d_1(X) d12(X)=d1(X) d 13 ( X ) = d 2 ( X ) d_{13}(X) = d_2(X) d13(X)=d2(X) d 23 ( X ) = d 3 ( X ) d_{23}(X) = d_3(X) d23(X)=d3(X)

在坐标上,画出 d 12 ( X ) , d 13 ( X ) , d 23 ( X ) d_{12}(X),d_{13}(X),d_{23}(X) d12(X),d13(X),d23(X),然后根据 ω i / ω j \omega_i/\omega_j ωi/ωj 两分法规则:
如果

d i ( X ) > d j ( X ) ( ∀ j = 1 , 2 , … , k , j ≠ i ) , d_i(X) > d_j(X) \quad (\forall j = 1,2,\dots,k, j \neq i), di(X)>dj(X)(j=1,2,,k,j=i),

X ∈ ω i X \in \omega_i Xωi
区分区域
- 当 d 12 ( X ) > 0 , d 13 ( X ) > 0 时 X ∈ ω 1 d_{12}(X)>0,d_{13}(X)>0 时 X \in \omega_1 d12(X)>0,d13(X)>0Xω1
- 当 d 21 ( X ) > 0 , d 23 ( X ) > 0 时 X ∈ ω 2 d_{21}(X)>0,d_{23}(X)>0 时 X \in \omega_2 d21(X)>0,d23(X)>0Xω2
- 当 d 31 ( X ) > 0 , d 32 ( X ) > 0 时 X ∈ ω 3 d_{31}(X)>0,d_{32}(X)>0 时 X \in \omega_3 d31(X)>0,d32(X)>0Xω3

在这里插入图片描述

  1. 没有不确定区域的 ω i / ω j \omega_i/\omega_j ωi/ωj 两分法。

    • 因为没有了不确定区域,所以必须所有分界线交叉于一个点,才不会有不确定区域,所以我们把三个判决函数两两相交得到新的三个分界线: d 1 ( X ) − d 2 ( X ) = 0 , d 1 ( X ) − d 2 ( X ) = 0 , d 2 ( X ) − d 3 ( X ) = 0 d_1(X)-d_2(X)=0,d_1(X)-d_2(X)=0,d_2(X)-d_3(X)=0 d1(X)d2(X)=0,d1(X)d2(X)=0,d2(X)d3(X)=0
    • 在坐标上画出这三条新的分界线

    根据没有不确定区域的 ω i / ω j \omega_i/\omega_j ωi/ωj 两分法的规则:

    如果

    d i ( X ) > d j ( X ) ( ∀ j = 1 , 2 , … , k , j ≠ i ) , d_i(X) > d_j(X) \quad (\forall j = 1,2,\dots,k, j \neq i), di(X)>dj(X)(j=1,2,,k,j=i),

    X ∈ ω i X \in \omega_i Xωi
    所以:

    • d 12 ( X ) > 0 , d 13 ( X ) > 0 时 X ∈ ω 1 d_{12}(X)>0,d_{13}(X)>0 时 X \in \omega_1 d12(X)>0,d13(X)>0Xω1
    • d 21 ( X ) > 0 , d 23 ( X ) > 0 时 X ∈ ω 2 d_{21}(X)>0,d_{23}(X)>0 时 X \in \omega_2 d21(X)>0,d23(X)>0Xω2
    • d 31 ( X ) > 0 , d 32 ( X ) > 0 时 X ∈ ω 3 d_{31}(X)>0,d_{32}(X)>0 时 X \in \omega_3 d31(X)>0,d32(X)>0Xω3

    区分区域

    在这里插入图片描述

可视化Python代码:
import numpy as np

import matplotlib.pyplot as plt

# 定义判决函数

def d1(X):

    return -X[0]

def d2(X):

    return X[0] + X[1] - 1

def d3(X):

    return X[0] - X[1] - 1

# 生成网格

x = np.linspace(-2, 2, 400)

y = np.linspace(-2, 2, 400)

X, Y = np.meshgrid(x, y)

# 计算判决函数值

D1 = d1([X, Y])

D2 = d2([X, Y])

D3 = d3([X, Y])

# 绘制判决边界

plt.figure(figsize=(18, 12))

# (1) ωi/ω̅i 两分法

plt.subplot(2, 3, 1)

plt.contourf(X, Y, (D1 > 0) & (D2 <= 0) & (D3 <= 0), alpha=0.3, cmap='Reds')

plt.contourf(X, Y, (D2 > 0) & (D1 <= 0) & (D3 <= 0), alpha=0.3, cmap='Greens')

plt.contourf(X, Y, (D3 > 0) & (D1 <= 0) & (D2 <= 0), alpha=0.3, cmap='Blues')

plt.contour(X, Y, D1, levels=[0], colors='r')

plt.contour(X, Y, D2, levels=[0], colors='g')

plt.contour(X, Y, D3, levels=[0], colors='b')

plt.title('ωi/ω̅i dichotomy')

plt.legend(['ω1', 'ω2', 'ω3'])

# (2) ωi/ωj 两分法

plt.subplot(2, 3, 2)

plt.contourf(X, Y, (D1 > 0) & (D2 > 0), alpha=0.3, cmap='Reds')

plt.contourf(X, Y, (-D1 > 0) & (D3 > 0), alpha=0.3, cmap='Greens')

plt.contourf(X, Y, (-D2 > 0) & (-D3 > 0), alpha=0.3, cmap='Blues')

plt.contour(X, Y, D1, levels=[0], colors='r')

plt.contour(X, Y, D2, levels=[0], colors='g')

plt.contour(X, Y, D3, levels=[0], colors='b')

plt.title('ωi/ωj dichotomy')

plt.legend(['ω1', 'ω2', 'ω3'])

  

# (3) 没有不确定区域的 ωi/ωj 两分法

plt.subplot(2, 3, 3)

plt.contourf(X, Y, (D1 > D2) & (D1 > D3), alpha=0.3, cmap='Reds')

plt.contourf(X, Y, (D2 > D1) & (D2 > D3), alpha=0.3, cmap='Greens')

plt.contourf(X, Y, (D3 > D1) & (D3 > D2), alpha=0.3, cmap='Blues')

plt.contour(X, Y, D1 - D2, levels=[0], colors='r')

plt.contour(X, Y, D1 - D3, levels=[0], colors='g')

plt.contour(X, Y, D2 - D3, levels=[0], colors='b')

plt.title('ωi/ωj dichotomy without uncertainty region')

plt.legend(['ω1', 'ω2', 'ω3'])

plt.tight_layout()

plt.show()

题目 2

如下三个训练样本集分别属于三个类别,用感知器算法学习一个多类别线性分类器:

x 1 = ( 1 , 1 ) T , x 2 = ( 2 , 2 ) T , x 3 = ( 2 , 0 ) T x_1=(1,1)^T,x_2=(2,2)^T,x_3=(2,0)^T x1=(1,1)T,x2=(2,2)T,x3=(2,0)T
初始化判别函数的权值矢量:

α 1 = ( − 4 , 1 , 3 ) T , α 2 = ( − 2 , 4 , − 2 ) T , α 3 = ( 1 , − 5 , 0 ) T \alpha_1=(-4,1,3)^T,\alpha_2=(-2,4,-2)^T,\alpha_3=(1,-5,0)^T α1=(4,1,3)T,α2=(2,4,2)T,α3=(1,5,0)T

解析:

将训练样本变成增广的特征矢量:

y 1 = ( 1 , 1 , 1 ) T , y 2 = ( 2 , 2 , 1 ) T , y 3 = ( 2 , 0 , 1 ) T y_1=(1,1,1)^T,y_2=(2,2,1)^T,y_3=(2,0,1)^T y1=(1,1,1)T,y2=(2,2,1)T,y3=(2,0,1)T
第一轮:

输入 y 1 y_1 y1,计算判别函数值:

g 1 ( y 1 ) = α 1 T y 1 = 0 ,   g 2 ( y 1 ) = α 2 T y 1 = 0 ,   g 3 ( y 1 ) = α 3 T y 1 = − 4 g_1(y_1)=\alpha_1^Ty_1=0,\:g_2(y_1)=\alpha_2^Ty_1=0,\:g_3(y_1)=\alpha_3^Ty_1=-4 g1(y1)=α1Ty1=0,g2(y1)=α2Ty1=0,g3(y1)=α3Ty1=4
g 3 < g 1 ≤ g 2 g_3<g_1\leq g_2 g3<g1g2,修正权值矢量:

α 1 = α 1 + y 1 = ( − 3 , 2 , 4 ) T \alpha_1=\alpha_1+y_1=(-3,2,4)^T α1=α1+y1=(3,2,4)T
α 2 = α 2 − y 1 = ( − 3 , 3 , − 3 ) T \alpha_2=\alpha_2-y_1=(-3,3,-3)^T α2=α2y1=(3,3,3)T
α 3 = α 3 = ( 1 , − 5 , 0 ) T \alpha_3=\alpha_3=(1,-5,0)^T α3=α3=(1,5,0)T
输入 y 2 y_2 y2,计算判别函数值:

g 1 ( y 2 ) = α 1 T y 2 = 2 ,   g 2 ( y 2 ) = α 2 T y 2 = − 3 ,   g 3 ( y 2 ) = α 3 T y 2 = − 8 g_1(y_2)=\alpha_1^Ty_2=2,\:g_2(y_2)=\alpha_2^Ty_2=-3,\:g_3(y_2)=\alpha_3^Ty_2=-8 g1(y2)=α1Ty2=2,g2(y2)=α2Ty2=3,g3(y2)=α3Ty2=8

g 3 < g 2 < g 1 g_3<g_2<g_1 g3<g2<g1,修正权值矢量:

α 1 = α 1 − y 2 = ( − 5 , 0 , 3 ) T \alpha_1=\alpha_1-y_2=(-5,0,3)^T α1=α1y2=(5,0,3)T

α 2 = α 2 + y 2 = ( − 1 , 5 , − 2 ) T \alpha_2=\alpha_2+y_2=(-1,5,-2)^T α2=α2+y2=(1,5,2)T

α 3 = α 3 = ( 1 , − 5 , 0 ) T \alpha_3=\alpha_3=(1,-5,0)^T α3=α3=(1,5,0)T

输入 y 3 y_3 y3,计算判别函数值:

g 1 ( y 3 ) = α 1 T y 3 = − 7 ,   g 2 ( y 3 ) = α 2 T y 3 = − 4 ,   g 3 ( y 3 ) = α 3 T y 3 = 2 g_1(y_3)=\alpha_1^Ty_3=-7,\:g_2(y_3)=\alpha_2^Ty_3=-4,\:g_3(y_3)=\alpha_3^Ty_3=2 g1(y3)=α1Ty3=7,g2(y3)=α2Ty3=4,g3(y3)=α3Ty3=2

g 3 > g 2 > g 1 g_3>g_2>g_1 g3>g2>g1 ,无需修正权值矢量;

第二轮:

输入 y 1 y_1 y1,计算判别函数值:

g 1 ( y 1 ) = α 1 T y 1 = − 2 ,   g 2 ( y 1 ) = α 2 T y 1 = 2 ,   g 3 ( y 1 ) = α 3 T y 1 = − 4 g_1(y_1)=\alpha_1^Ty_1=-2,\:g_2(y_1)=\alpha_2^Ty_1=2,\:g_3(y_1)=\alpha_3^Ty_1=-4 g1(y1)=α1Ty1=2,g2(y1)=α2Ty1=2,g3(y1)=α3Ty1=4

g 3 < g 1 < g 2 g_3<g_1<g_2 g3<g1<g2,修正权值矢量:

α 1 = α 1 + y 1 = ( − 4 , 1 , 4 ) T \alpha_1=\alpha_1+y_1=(-4,1,4)^T α1=α1+y1=(4,1,4)T

α 2 = α 2 − y 1 = ( − 2 , 4 , − 3 ) T \alpha_2=\alpha_2-y_1=(-2,4,-3)^T α2=α2y1=(2,4,3)T

α 3 = α 3 = ( 1 , − 5 , 0 ) T \alpha_3=\alpha_3=(1,-5,0)^T α3=α3=(1,5,0)T

输入 y 2 y_2 y2,计算判别函数值:

g 1 ( y 2 ) = α 1 T y 2 = − 2 ,   g 2 ( y 2 ) = α 2 T y 2 = 1 ,   g 3 ( y 2 ) = α 3 T y 2 = − 8 g_1(y_2)=\alpha_1^Ty_2=-2,\:g_2(y_2)=\alpha_2^Ty_2=1,\:g_3(y_2)=\alpha_3^Ty_2=-8 g1(y2)=α1Ty2=2,g2(y2)=α2Ty2=1,g3(y2)=α3Ty2=8

g 2 > g 1 > g 3 g_2>g_1>g_3 g2>g1>g3,无需修正权值矢量;

输入 y 3 y_3 y3,计算判别函数值:
g 1 ( y 3 ) = α 1 T y 3 = − 4 ,   g 2 ( y 3 ) = α 2 T y 3 = − 1 ,   g 3 ( y 3 ) = α 3 T y 3 = 2 g_1(y_3)=\alpha_1^Ty_3=-4,\:g_2(y_3)=\alpha_2^Ty_3=-1,\:g_3(y_3)=\alpha_3^Ty_3=2 g1(y3)=α1Ty3=4,g2(y3)=α2Ty3=1,g3(y3)=α3Ty3=2
g 3 > g 2 > g 1 g_3>g_2>g_1 g3>g2>g1 ,无需修正权值矢量;

第三轮:

输入 y 1 y_1 y1,计算判别函数值:
g 1 ( y 1 ) = α 1 T y 1 = 1 ,   g 2 ( y 1 ) = α 2 T y 1 = − 1 ,   g 3 ( y 1 ) = α 3 T y 1 = − 4 g_1(y_1)=\alpha_1^Ty_1=1,\:g_2(y_1)=\alpha_2^Ty_1=-1,\:g_3(y_1)=\alpha_3^Ty_1=-4 g1(y1)=α1Ty1=1,g2(y1)=α2Ty1=1,g3(y1)=α3Ty1=4
g 1 > g 2 > g 3 g_1>g_2>g_3 g1>g2>g3,无需修正权值矢量;

分类器能够正确识别全部训练样本,输出权值矢量:
α 1 = ( − 4 , 1 , 4 ) T , α 2 = ( − 2 , 4 , − 3 ) T , α 3 = ( 1 , − 5 , 0 ) T \alpha_1=(-4,1,4)^T,\alpha_2=(-2,4,-3)^T,\alpha_3=(1,-5,0)^T α1=(4,1,4)T,α2=(2,4,3)T,α3=(1,5,0)T

对应三个类别的分类函数为:

g 1 ( x ) = − 4 x 1 + x 2 + 4 , g 2 ( x ) = − 2 x 1 + 4 x 2 − 3 , g 3 ( x ) = x 1 − 5 x 2 g_1(x)=-4x_1+x_2+4,\quad g_2(x)=-2x_1+4x_2-3,\quad g_3(x)=x_1-5x_2 g1(x)=4x1+x2+4,g2(x)=2x1+4x23,g3(x)=x15x2
转换成一对一式的判别函数:
g 12 ( x ) = g 1 ( x ) − g 2 ( x ) = − 2 x 1 − 3 x 2 + 7 g_{12}(x)=g_1(x)-g_2(x)=-2x_1-3x_2+7 g12(x)=g1(x)g2(x)=2x13x2+7
g 13 ( x ) = g 1 ( x ) − g 3 ( x ) = − 5 x 1 + 6 x 2 + 4 g_{13}(x)=g_1(x)-g_3(x)=-5x_1+6x_2+4 g13(x)=g1(x)g3(x)=5x1+6x2+4
g 23 ( x ) = g 2 ( x ) − g 3 ( x ) = − 3 x 1 + 9 x 2 − 3 g_{23}(x)=g_2(x)-g_3(x)=-3x_1+9x_2-3 g23(x)=g2(x)g3(x)=3x1+9x23

题目 3

设两类样本的类内散布矩阵分别为 S 1 = [ 1 1 2 1 2 1 ] , S 2 = [ 1 − 1 2 − 1 2 1 ] S_1= \begin{bmatrix} 1& \frac{1}{2}\\ \frac{1}{2}& 1\end{bmatrix} , S_2= \begin{bmatrix} 1& - \frac{1}{2}\\ - \frac{1}{2}& 1\end{bmatrix} S1=[121211],S2=[121211], 两类的类心分别为 m 1 = ( 2 , 0 ) T \mathbf{m} _{1}= ( 2, 0) ^{\mathrm{T} } m1=(2,0)T, m 2 = ( 2 , 2 ) T \mathbf{m} _{2}= ( 2, 2) ^{\mathrm{T} } m2=(2,2)T,试用 fisher 准则求其决策面方程。

解: s w = [ 1 1 2 1 2 1 ] + [ 1 − 1 2 − 1 2 1 ] = [ 2 0 0 2 ] s_w=\begin{bmatrix}1&\frac{1}{2}\\\frac{1}{2}&1\end{bmatrix}+\begin{bmatrix}1&-\frac{1}{2}\\-\frac{1}{2}&1\end{bmatrix}=\begin{bmatrix}2&0\\0&2\end{bmatrix} sw=[121211]+[121211]=[2002]
S w − 1 = [ 1 2 0 0 1 2 ] S_w^{-1}=\begin{bmatrix}\frac{1}{2}&0\\0&\frac{1}{2}\end{bmatrix} Sw1=[210021]

投影方向为 W = S w − 1 ( m 1 − m 2 ) = [ 1 2 0 0 1 2 ] ( 0 − 2 ) = ( 0 − 1 ) W=S_w^{-1}(m_1-m_2)=\begin{bmatrix}\frac12&0\\0&\frac12\end{bmatrix}\begin{pmatrix}0\\-2\end{pmatrix}=\begin{pmatrix}0\\-1\end{pmatrix} W=Sw1(m1m2)=[210021](02)=(01)
则决策面方程为 y = W T ( x − m 1 + m 2 2 ) y=W^T\left(x-\frac{m_1+m_2}{2}\right) y=WT(x2m1+m2)
=(0 − 1 ) ( x 1 2 − 2 ˊ x 2 − 1 ) - 1) \begin{pmatrix} x_1^2- \acute{2} \\ x_2- 1\end{pmatrix} 1)(x122ˊx21)
= − x 2 + 1 =-x_{2}+1 =x2+1
w ∗ = S w − 1 ( m 1 − m 2 ) = [ 1 − 1 − 1 ] 则决策面方程为  y = w ∗ T ( x − m 1 + m 2 2 ) = [ 1 − 1 − 1 ] [ x 1 − 1 2 x 2 − 1 2 x 3 − 1 2 ] = x 1 − x 2 − x 3 + 1 2 \begin{aligned} & w^{*}=S_{w}^{-1}(m_{1}-m_{2})= \begin{bmatrix} 1 \\ -1 \\ -1 \end{bmatrix} \\ & \text{则决策面方程为 }y=w^{*T}\left(x-\frac{m_1+m_2}{2}\right) \\ & = \begin{bmatrix} 1 & -1 & -1 \end{bmatrix} \begin{bmatrix} x_1-\frac{1}{2} \\ x_2-\frac{1}{2} \\ x_3-\frac{1}{2} \end{bmatrix} \\ & =x_1-x_2-x_3+\frac{1}{2} \end{aligned} w=Sw1(m1m2)= 111 则决策面方程为 y=wT(x2m1+m2)=[111] x121x221x321 =x1x2x3+21

题目 4

x 1 1 = [ 0 , 0 , 0 ] T   , x 1 2 = [ 1 , 0 , 0 ] T   , x 1 3 = [ 1 , 0 , 1 ] T   , x 1 4 = [ 1 , 1 , 0 ] T x 2 1 = [ 0 , 0 , 1 ] T   , x 2 2 = [ 0 , 1 , 0 ] T   , x 2 3 = [ 0 , 1 , 1 ] T   , x 2 4 = [ 1 , 1 , 1 ] T x_{1}^{1}=[0,0,0]^{T}\:,\quad x_{1}^{2}=[1,0,0]^{T}\:,\quad x_{1}^{3}=[1,0,1]^{T}\:,\quad x_{1}^{4}=[1,1,0]^{T}\\x_{2}^{1}=[0,0,1]^{T}\:,\quad x_{2}^{2}=[0,1,0]^{T}\:,\quad x_{2}^{3}=[0,1,1]^{T}\:,\quad x_{2}^{4}=[1,1,1]^{T} x11=[0,0,0]T,x12=[1,0,0]T,x13=[1,0,1]T,x14=[1,1,0]Tx21=[0,0,1]T,x22=[0,1,0]T,x23=[0,1,1]T,x24=[1,1,1]T
使用Fisher线性判别方法给出这两类样本的分类面。

解析:

m 1 = [ 0.75 0.25 0.25 ] m 2 = [ 0.25 0.75 0.75 ] m_1=\begin{bmatrix}0.75\\0.25\\0.25\end{bmatrix}\quad m_2=\begin{bmatrix}0.25\\0.75\\0.75\end{bmatrix} m1= 0.750.250.25 m2= 0.250.750.75
S 1 = ∑ i = 1 4 ( x i − m 1 ) ( x i − m 1 ) T = [ 9 16 3 16 3 16 3 16 1 16 1 16 3 16 1 16 1 16 ] + [ 1 16 − 1 16 − 1 16 1 16 1 16 1 16 − 1 16 1 16 1 16 ] + [ 1 16 − 1 16 3 16 − 1 16 1 16 − 3 16 3 16 − 3 16 9 16 ] \begin{gathered}S_{1}=\sum_{i=1}^{4}(x_{i}-m_{1})(x_{i}-m_{1})^{T}=\begin{bmatrix}\dfrac{9}{16}&\dfrac{3}{16}&\dfrac{3}{16}\\\dfrac{3}{16}&\dfrac{1}{16}&\dfrac{1}{16}\\\dfrac{3}{16}&\dfrac{1}{16}&\dfrac{1}{16}\end{bmatrix}+\begin{bmatrix}\dfrac{1}{16}&-\dfrac{1}{16}&-\dfrac{1}{16}\\\dfrac{1}{16}&\dfrac{1}{16}&\dfrac{1}{16}\\-\dfrac{1}{16}&\dfrac{1}{16}&\dfrac{1}{16}\end{bmatrix}+\begin{bmatrix}\dfrac{1}{16}&-\dfrac{1}{16}&\dfrac{3}{16}\\-\dfrac{1}{16}&\dfrac{1}{16}&-\dfrac{3}{16}\\\dfrac{3}{16}&-\dfrac{3}{16}&\dfrac{9}{16}\end{bmatrix}\end{gathered} S1=i=14(xim1)(xim1)T= 169163163163161161163161161 + 161161161161161161161161161 + 161161163161161163163163169
+ [ 1 16 3 16 − 1 16 3 16 9 16 − 3 16 − 1 16 − 3 16 1 16 ] = [ 3 4 1 4 1 4 1 4 3 4 − 1 4 1 4 − 1 4 3 4 ] \begin{aligned}+\begin{bmatrix}\dfrac{1}{16}&\dfrac{3}{16}&-\dfrac{1}{16}\\\dfrac{3}{16}&\dfrac{9}{16}&-\dfrac{3}{16}\\-\dfrac{1}{16}&-\dfrac{3}{16}&\dfrac{1}{16}\end{bmatrix}=\begin{bmatrix}\dfrac{3}{4}&\dfrac{1}{4}&\dfrac{1}{4}\\\dfrac{1}{4}&\dfrac{3}{4}&-\dfrac{1}{4}\\\dfrac{1}{4}&-\dfrac{1}{4}&\dfrac{3}{4}\end{bmatrix}\end{aligned} + 161163161163169163161163161 = 434141414341414143

S 2 = ∑ i = 1 4 ( x i − m 2 ) ( x i − m 2 ) T = [ 1 16 3 16 − 1 16 3 16 9 16 − 3 16 − 1 16 − 3 16 1 16 ] + [ 1 16 − 1 16 3 16 − 1 16 1 16 − 3 16 3 16 − 3 16 9 16 ] S_{2}=\sum_{i=1}^{4}(x_{i}-m_{2})(x_{i}-m_{2})^{T}=\begin{bmatrix}\dfrac{1}{16}&\dfrac{3}{16}&-\dfrac{1}{16}\\\dfrac{3}{16}&\dfrac{9}{16}&-\dfrac{3}{16}\\-\dfrac{1}{16}&-\dfrac{3}{16}&\dfrac{1}{16}\end{bmatrix}+\begin{bmatrix}\dfrac{1}{16}&-\dfrac{1}{16}&\dfrac{3}{16}\\-\dfrac{1}{16}&\dfrac{1}{16}&-\dfrac{3}{16}\\\dfrac{3}{16}&-\dfrac{3}{16}&\dfrac{9}{16}\end{bmatrix} S2=i=14(xim2)(xim2)T= 161163161163169163161163161 + 161161163161161163163163169
+ [ 1 16 − 1 16 − 1 16 − 1 16 1 16 1 16 − 1 16 1 16 1 16 ] + [ 9 16 3 16 3 16 3 16 1 16 1 16 3 16 1 16 1 16 ] = [ 3 4 1 4 1 4 1 4 3 4 − 1 4 1 4 − 1 4 3 4 ] +\begin{bmatrix}\dfrac{1}{16}&-\dfrac{1}{16}&-\dfrac{1}{16}\\-\dfrac{1}{16}&\dfrac{1}{16}&\dfrac{1}{16}\\-\dfrac{1}{16}&\dfrac{1}{16}&\dfrac{1}{16}\end{bmatrix}+\begin{bmatrix}\dfrac{9}{16}&\dfrac{3}{16}&\dfrac{3}{16}\\\dfrac{3}{16}&\dfrac{1}{16}&\dfrac{1}{16}\\\dfrac{3}{16}&\dfrac{1}{16}&\dfrac{1}{16}\end{bmatrix}=\begin{bmatrix}\dfrac{3}{4}&\dfrac{1}{4}&\dfrac{1}{4}\\\dfrac{1}{4}&\dfrac{3}{4}&-\dfrac{1}{4}\\\dfrac{1}{4}&-\dfrac{1}{4}&\dfrac{3}{4}\end{bmatrix} + 161161161161161161161161161 + 169163163163161161163161161 = 434141414341414143
S w = ( S 1 + S 2 ) = 1 2 [ 3 1 1 1 3 − 1 1 − 1 3 ] S w − 1 = ( 1 − 1 2 − 1 2 − 1 2 1 1 2 − 1 2 1 2 1 ) S_w=\quad(S_1+S_2)=\dfrac{1}{2}\begin{bmatrix}3&1&1\\1&3&-1\\1&-1&3\end{bmatrix}\quad S_w^{-1}=\begin{pmatrix}1&-\dfrac{1}{2}&-\dfrac{1}{2}\\-\dfrac{1}{2}&1&\dfrac{1}{2}\\-\dfrac{1}{2}&\dfrac{1}{2}&1\end{pmatrix} Sw=(S1+S2)=21 311131113 Sw1= 121212112121211

w ∗ = S w − 1 ( m 1 − m 2 ) = [ 1 − 1 − 1 ] , y 0 = w ∗ T m 1 + w ∗ T m 2 2 = − 1 2 w^*=S_w^{-1}(m_1-m_2)=\begin{bmatrix}1\\-1\\-1\end{bmatrix},\quad y_0=\frac{w^{*T}m_1+w^{*T}m_2}{2}=-\frac{1}{2} w=Sw1(m1m2)= 111 ,y0=2wTm1+wTm2=21

则决策面方程为 w ∗ T x − y 0 w^{*T}x-y_0 wTxy0

= ∣ x 1 x 2 x 3 ∣ + 1 2 \begin{vmatrix} x_{1}\\ x_{2}\\ x_{3}\end{vmatrix} + \frac 12 x1x2x3 +21

= x 1 − x 2 − x 3 + 1 2 =x_{1}-x_{2}-x_{3}+\frac{1}{2} =x1x2x3+21

决策面方程为 0 = w ∗ T ( x − m 1 + m 2 2 ) 0=w^*T\left(x-\frac{m_1+m_2}2\right) 0=wT(x2m1+m2)

= [ x 1 − 1 2 x 2 − 1 2 x 3 − 1 2 ] \begin{bmatrix} x_1- \frac 12\\ x_2- \frac 12\\ x_3- \frac 12\end{bmatrix} x121x221x321

= x 1 − x 2 − x 3 + 1 2 =x_{1}-x_{2}-x_{3}+\frac{1}{2} =x1x2x3+21

或者也可以写为
决策面方程为  w ∗ T ( x − m 1 + m 2 2 ) = [ 1 − 1 − 1 ] [ x 1 − 1 2 x 2 − 1 2 x 3 − 1 2 ] = x 1 − x 2 − x 3 + 1 2 \begin{aligned}\text{决策面方程为 }&w^{*T}\left(x-\frac{m_{1}+m_{2}}{2}\right)\\&=\begin{bmatrix}1&-1&-1\end{bmatrix}\begin{bmatrix}x_1-\frac12\\x_2-\frac12\\x_3-\frac12\end{bmatrix}\\&=x_1-x_2-x_3+\frac12\end{aligned} 决策面方程为 wT(x2m1+m2)=[111] x121x221x321 =x1x2x3+21

题目 5

4.5.对于样本空间中的一划分超平面 w T w^T wTx + b = 0 +b=0 +b=0,有 w T = ( − 1 , 3 , 2 ) w^T= ( - 1, 3, 2) wT=(1,3,2),b= 1, 则判断向量(4.-2.2)、(2.5.-6.5)、(4.-2.4) 是否为支持向量,并求出间隔。

解析
  • 公式如下
    y i [ ( w T ⋅ x i ) + b ] = 1 { ( w T ⋅ x i ) + b = 1 , y i = + 1 ( w T ⋅ x i ) + b = − 1 , y i = − 1 M = 2 ∥ w ∥ \begin{gathered} y_i[(w^T\cdot x_i)+b]=1 \\ \begin{cases} \left(w^T\cdot x_i\right)+b=1,y_i=+1 \\ \left(w^T\cdot x_i\right)+b=-1,y_i=-1 & \end{cases} \\ \mathrm{M}=\frac{2}{\|w\|} \end{gathered} yi[(wTxi)+b]=1{(wTxi)+b=1,yi=+1(wTxi)+b=1,yi=1M=w2
    解 : 最大间隔为 : d = 2 ∣ ∣ w ∣ ∣ = 2 1 + 9 + 4 = 14 7 判断向量是否为支持向量 ① x 1 = ( 4 , − 2 , 2 ) W T x 1 + b = − 4 − 6 + 4 + 1 = 5 > 1 x 1 不是支持向量 ② x 2 = ( 2 , 5 , − 6.5 ) W 7 x 2 + b = − 2 + 15 − 13 + 1 = 1 x 2 是支持向量 . ③ x 3 = ( 4 , − 2 , 4 ) w T x 3 + b = − 4 − 6 + 8 + 1 = − 1 x 3 是支持向量 \begin{aligned} 解: \\ & 最大间隔为:d=\frac{2}{||w||}=\frac{2}{\sqrt{1+9+4}}=\frac{\sqrt{14}}{7} \\ & 判断向量是否为支持向量 \\ & ①x_{1}=(4,-2,2) \\ & W^{T}x_{1}+b=-4-6+4+1=5>1 \\ & x_{1}不是支持向量 \\ & ②x_{2}=(2,5,-6.5) \\ & W^{7}x_{2}+b=-2+15-13+1=1 \\ & x_{2}是支持向量 \\ & \mathrm{.}③x_{3}=(4,-2,4) \\ & w^{T}x_{3}+b=-4-6+8+1=-1 \\ & x_{3}是支持向量 \end{aligned} :最大间隔为:d=∣∣w∣∣2=1+9+4 2=714 判断向量是否为支持向量x1=(4,2,2)WTx1+b=46+4+1=5>1x1不是支持向量x2=(2,5,6.5)W7x2+b=2+1513+1=1x2是支持向量.x3=(4,2,4)wTx3+b=46+8+1=1x3是支持向量

![[4支持向量机.png]]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值