模式识别
目录
第一章 绪论
第二章 贝叶斯决策理论
第三章 概率密度函数的参数估计
第四章 非参数判别分类方法
第五章 聚类分析
第六章 特征提取与选择
- 本系列博客包含2,3,4,5,6章的内容
引言
这是我期末复习时候整理的笔记。我会把每一章单独发一篇博客,都搞到一起无法发布,提示字数太多没办法了。
- 教材:模式识别及MATLAB实现
- ISBN:
978-7-121-32127-6
第四章 非参数判别分类方法
题目 1
设一3类问题有如下判决函数:
d 1 ( X ) = − x 1 d_1(X) = -x_1 d1(X)=−x1
d 2 ( X ) = x 1 + x 2 − 1 d_2(X) = x_1 + x_2 - 1 d2(X)=x1+x2−1
d 3 ( X ) = x 1 − x 2 − 1 d_3(X) = x_1 - x_2 - 1 d3(X)=x1−x2−1
试画出下列各种情况的判决边界及各类的区域:
(1) ω i / ω i ‾ \omega_i/\overline{\omega_i} ωi/ωi 两分法;
(2) ω i / ω j \omega_i/\omega_j ωi/ωj 两分法,且令 d 12 ( X ) = d 1 ( X ) d_{12}(X) = d_1(X) d12(X)=d1(X), d 13 ( X ) = d 2 ( X ) d_{13}(X) = d_2(X) d13(X)=d2(X), d 23 ( X ) = d 3 ( X ) d_{23}(X) = d_3(X) d23(X)=d3(X);
(3) 没有不确定区域的 ω i / ω j \omega_i/\omega_j ωi/ωj 两分法。
-
方法解释:
-
ω i / ω i ‾ \omega_i/\overline{\omega_i} ωi/ωi 两分法:如果
{ d i ( X ) > 0 d j ( X ) ≤ 0 ( ∀ j ≠ i ) , \begin{cases} d_i(X) > 0 \\ d_j(X) \leq 0 \quad (\forall j \neq i), \end{cases} {di(X)>0dj(X)≤0(∀j=i),
则 X ∈ ω i ( i = 1 , 2 , … , c ) X \in \omega_i \quad (i = 1,2,\dots,c) X∈ωi(i=1,2,…,c)。
-
ω i / ω j \omega_i/\omega_j ωi/ωj 两分法:如果
d i j ( X ) > 0 ( ∀ j = 1 , 2 , … , k , j ≠ i ) d_{ij}(X) > 0 \quad (\forall j = 1,2,\dots,k, j \neq i) dij(X)>0(∀j=1,2,…,k,j=i)
则 X ∈ ω i X \in \omega_i X∈ωi。
-
没有不确定区域的 ω i / ω j \omega_i/\omega_j ωi/ωj 两分法:
如果
d i ( X ) > d j ( X ) ( ∀ j = 1 , 2 , … , k , j ≠ i ) , d_i(X) > d_j(X) \quad (\forall j = 1,2,\dots,k, j \neq i), di(X)>dj(X)(∀j=1,2,…,k,j=i),
则 X ∈ ω i X \in \omega_i X∈ωi。
-
答案:
红色区域表示
ω
1
\omega_1
ω1
绿色区域表示
ω
2
\omega_2
ω2
蓝色区域表示
ω
3
\omega_3
ω3
- ω i / ω i ‾ \omega_i/\overline{\omega_i} ωi/ωi 两分法
在坐标上,画出 d 1 ( X ) , d 2 ( X ) , d 3 ( X ) d_1(X),d_2(X),d_3(X) d1(X),d2(X),d3(X) ,然后根据 ω i / ω i ‾ \omega_i/\overline{\omega_i} ωi/ωi 两分法:
{ d i ( X ) > 0 d j ( X ) ≤ 0 ( ∀ j ≠ i ) , \begin{cases} d_i(X) > 0 \\ d_j(X) \leq 0 \quad (\forall j \neq i), \end{cases} {di(X)>0dj(X)≤0(∀j=i),
X ∈ ω i ( i = 1 , 2 , … , c ) X \in \omega_i \quad (i = 1,2,\dots,c) X∈ωi(i=1,2,…,c)
规则区分区域
- ω i / ω j \omega_i/\omega_j ωi/ωj 两分法,且令 d 12 ( X ) = d 1 ( X ) d_{12}(X) = d_1(X) d12(X)=d1(X), d 13 ( X ) = d 2 ( X ) d_{13}(X) = d_2(X) d13(X)=d2(X), d 23 ( X ) = d 3 ( X ) d_{23}(X) = d_3(X) d23(X)=d3(X)
在坐标上,画出
d
12
(
X
)
,
d
13
(
X
)
,
d
23
(
X
)
d_{12}(X),d_{13}(X),d_{23}(X)
d12(X),d13(X),d23(X),然后根据
ω
i
/
ω
j
\omega_i/\omega_j
ωi/ωj 两分法规则:
如果
d i ( X ) > d j ( X ) ( ∀ j = 1 , 2 , … , k , j ≠ i ) , d_i(X) > d_j(X) \quad (\forall j = 1,2,\dots,k, j \neq i), di(X)>dj(X)(∀j=1,2,…,k,j=i),
则
X
∈
ω
i
X \in \omega_i
X∈ωi。
区分区域
- 当
d
12
(
X
)
>
0
,
d
13
(
X
)
>
0
时
X
∈
ω
1
d_{12}(X)>0,d_{13}(X)>0 时 X \in \omega_1
d12(X)>0,d13(X)>0时X∈ω1
- 当
d
21
(
X
)
>
0
,
d
23
(
X
)
>
0
时
X
∈
ω
2
d_{21}(X)>0,d_{23}(X)>0 时 X \in \omega_2
d21(X)>0,d23(X)>0时X∈ω2
- 当
d
31
(
X
)
>
0
,
d
32
(
X
)
>
0
时
X
∈
ω
3
d_{31}(X)>0,d_{32}(X)>0 时 X \in \omega_3
d31(X)>0,d32(X)>0时X∈ω3
-
没有不确定区域的 ω i / ω j \omega_i/\omega_j ωi/ωj 两分法。
- 因为没有了不确定区域,所以必须所有分界线交叉于一个点,才不会有不确定区域,所以我们把三个判决函数两两相交得到新的三个分界线: d 1 ( X ) − d 2 ( X ) = 0 , d 1 ( X ) − d 2 ( X ) = 0 , d 2 ( X ) − d 3 ( X ) = 0 d_1(X)-d_2(X)=0,d_1(X)-d_2(X)=0,d_2(X)-d_3(X)=0 d1(X)−d2(X)=0,d1(X)−d2(X)=0,d2(X)−d3(X)=0
- 在坐标上画出这三条新的分界线
根据没有不确定区域的 ω i / ω j \omega_i/\omega_j ωi/ωj 两分法的规则:
如果
d i ( X ) > d j ( X ) ( ∀ j = 1 , 2 , … , k , j ≠ i ) , d_i(X) > d_j(X) \quad (\forall j = 1,2,\dots,k, j \neq i), di(X)>dj(X)(∀j=1,2,…,k,j=i),
则 X ∈ ω i X \in \omega_i X∈ωi。
所以:- 当 d 12 ( X ) > 0 , d 13 ( X ) > 0 时 X ∈ ω 1 d_{12}(X)>0,d_{13}(X)>0 时 X \in \omega_1 d12(X)>0,d13(X)>0时X∈ω1
- 当 d 21 ( X ) > 0 , d 23 ( X ) > 0 时 X ∈ ω 2 d_{21}(X)>0,d_{23}(X)>0 时 X \in \omega_2 d21(X)>0,d23(X)>0时X∈ω2
- 当 d 31 ( X ) > 0 , d 32 ( X ) > 0 时 X ∈ ω 3 d_{31}(X)>0,d_{32}(X)>0 时 X \in \omega_3 d31(X)>0,d32(X)>0时X∈ω3
区分区域
可视化Python代码:
import numpy as np
import matplotlib.pyplot as plt
# 定义判决函数
def d1(X):
return -X[0]
def d2(X):
return X[0] + X[1] - 1
def d3(X):
return X[0] - X[1] - 1
# 生成网格
x = np.linspace(-2, 2, 400)
y = np.linspace(-2, 2, 400)
X, Y = np.meshgrid(x, y)
# 计算判决函数值
D1 = d1([X, Y])
D2 = d2([X, Y])
D3 = d3([X, Y])
# 绘制判决边界
plt.figure(figsize=(18, 12))
# (1) ωi/ω̅i 两分法
plt.subplot(2, 3, 1)
plt.contourf(X, Y, (D1 > 0) & (D2 <= 0) & (D3 <= 0), alpha=0.3, cmap='Reds')
plt.contourf(X, Y, (D2 > 0) & (D1 <= 0) & (D3 <= 0), alpha=0.3, cmap='Greens')
plt.contourf(X, Y, (D3 > 0) & (D1 <= 0) & (D2 <= 0), alpha=0.3, cmap='Blues')
plt.contour(X, Y, D1, levels=[0], colors='r')
plt.contour(X, Y, D2, levels=[0], colors='g')
plt.contour(X, Y, D3, levels=[0], colors='b')
plt.title('ωi/ω̅i dichotomy')
plt.legend(['ω1', 'ω2', 'ω3'])
# (2) ωi/ωj 两分法
plt.subplot(2, 3, 2)
plt.contourf(X, Y, (D1 > 0) & (D2 > 0), alpha=0.3, cmap='Reds')
plt.contourf(X, Y, (-D1 > 0) & (D3 > 0), alpha=0.3, cmap='Greens')
plt.contourf(X, Y, (-D2 > 0) & (-D3 > 0), alpha=0.3, cmap='Blues')
plt.contour(X, Y, D1, levels=[0], colors='r')
plt.contour(X, Y, D2, levels=[0], colors='g')
plt.contour(X, Y, D3, levels=[0], colors='b')
plt.title('ωi/ωj dichotomy')
plt.legend(['ω1', 'ω2', 'ω3'])
# (3) 没有不确定区域的 ωi/ωj 两分法
plt.subplot(2, 3, 3)
plt.contourf(X, Y, (D1 > D2) & (D1 > D3), alpha=0.3, cmap='Reds')
plt.contourf(X, Y, (D2 > D1) & (D2 > D3), alpha=0.3, cmap='Greens')
plt.contourf(X, Y, (D3 > D1) & (D3 > D2), alpha=0.3, cmap='Blues')
plt.contour(X, Y, D1 - D2, levels=[0], colors='r')
plt.contour(X, Y, D1 - D3, levels=[0], colors='g')
plt.contour(X, Y, D2 - D3, levels=[0], colors='b')
plt.title('ωi/ωj dichotomy without uncertainty region')
plt.legend(['ω1', 'ω2', 'ω3'])
plt.tight_layout()
plt.show()
题目 2
如下三个训练样本集分别属于三个类别,用感知器算法学习一个多类别线性分类器:
x
1
=
(
1
,
1
)
T
,
x
2
=
(
2
,
2
)
T
,
x
3
=
(
2
,
0
)
T
x_1=(1,1)^T,x_2=(2,2)^T,x_3=(2,0)^T
x1=(1,1)T,x2=(2,2)T,x3=(2,0)T
初始化判别函数的权值矢量:
α 1 = ( − 4 , 1 , 3 ) T , α 2 = ( − 2 , 4 , − 2 ) T , α 3 = ( 1 , − 5 , 0 ) T \alpha_1=(-4,1,3)^T,\alpha_2=(-2,4,-2)^T,\alpha_3=(1,-5,0)^T α1=(−4,1,3)T,α2=(−2,4,−2)T,α3=(1,−5,0)T
解析:
将训练样本变成增广的特征矢量:
y
1
=
(
1
,
1
,
1
)
T
,
y
2
=
(
2
,
2
,
1
)
T
,
y
3
=
(
2
,
0
,
1
)
T
y_1=(1,1,1)^T,y_2=(2,2,1)^T,y_3=(2,0,1)^T
y1=(1,1,1)T,y2=(2,2,1)T,y3=(2,0,1)T
第一轮:
输入 y 1 y_1 y1,计算判别函数值:
g
1
(
y
1
)
=
α
1
T
y
1
=
0
,
g
2
(
y
1
)
=
α
2
T
y
1
=
0
,
g
3
(
y
1
)
=
α
3
T
y
1
=
−
4
g_1(y_1)=\alpha_1^Ty_1=0,\:g_2(y_1)=\alpha_2^Ty_1=0,\:g_3(y_1)=\alpha_3^Ty_1=-4
g1(y1)=α1Ty1=0,g2(y1)=α2Ty1=0,g3(y1)=α3Ty1=−4
g
3
<
g
1
≤
g
2
g_3<g_1\leq g_2
g3<g1≤g2,修正权值矢量:
α
1
=
α
1
+
y
1
=
(
−
3
,
2
,
4
)
T
\alpha_1=\alpha_1+y_1=(-3,2,4)^T
α1=α1+y1=(−3,2,4)T
α
2
=
α
2
−
y
1
=
(
−
3
,
3
,
−
3
)
T
\alpha_2=\alpha_2-y_1=(-3,3,-3)^T
α2=α2−y1=(−3,3,−3)T
α
3
=
α
3
=
(
1
,
−
5
,
0
)
T
\alpha_3=\alpha_3=(1,-5,0)^T
α3=α3=(1,−5,0)T
输入
y
2
y_2
y2,计算判别函数值:
g 1 ( y 2 ) = α 1 T y 2 = 2 , g 2 ( y 2 ) = α 2 T y 2 = − 3 , g 3 ( y 2 ) = α 3 T y 2 = − 8 g_1(y_2)=\alpha_1^Ty_2=2,\:g_2(y_2)=\alpha_2^Ty_2=-3,\:g_3(y_2)=\alpha_3^Ty_2=-8 g1(y2)=α1Ty2=2,g2(y2)=α2Ty2=−3,g3(y2)=α3Ty2=−8
g 3 < g 2 < g 1 g_3<g_2<g_1 g3<g2<g1,修正权值矢量:
α 1 = α 1 − y 2 = ( − 5 , 0 , 3 ) T \alpha_1=\alpha_1-y_2=(-5,0,3)^T α1=α1−y2=(−5,0,3)T
α 2 = α 2 + y 2 = ( − 1 , 5 , − 2 ) T \alpha_2=\alpha_2+y_2=(-1,5,-2)^T α2=α2+y2=(−1,5,−2)T
α 3 = α 3 = ( 1 , − 5 , 0 ) T \alpha_3=\alpha_3=(1,-5,0)^T α3=α3=(1,−5,0)T
输入 y 3 y_3 y3,计算判别函数值:
g 1 ( y 3 ) = α 1 T y 3 = − 7 , g 2 ( y 3 ) = α 2 T y 3 = − 4 , g 3 ( y 3 ) = α 3 T y 3 = 2 g_1(y_3)=\alpha_1^Ty_3=-7,\:g_2(y_3)=\alpha_2^Ty_3=-4,\:g_3(y_3)=\alpha_3^Ty_3=2 g1(y3)=α1Ty3=−7,g2(y3)=α2Ty3=−4,g3(y3)=α3Ty3=2
g 3 > g 2 > g 1 g_3>g_2>g_1 g3>g2>g1 ,无需修正权值矢量;
第二轮:
输入 y 1 y_1 y1,计算判别函数值:
g 1 ( y 1 ) = α 1 T y 1 = − 2 , g 2 ( y 1 ) = α 2 T y 1 = 2 , g 3 ( y 1 ) = α 3 T y 1 = − 4 g_1(y_1)=\alpha_1^Ty_1=-2,\:g_2(y_1)=\alpha_2^Ty_1=2,\:g_3(y_1)=\alpha_3^Ty_1=-4 g1(y1)=α1Ty1=−2,g2(y1)=α2Ty1=2,g3(y1)=α3Ty1=−4
g 3 < g 1 < g 2 g_3<g_1<g_2 g3<g1<g2,修正权值矢量:
α 1 = α 1 + y 1 = ( − 4 , 1 , 4 ) T \alpha_1=\alpha_1+y_1=(-4,1,4)^T α1=α1+y1=(−4,1,4)T
α 2 = α 2 − y 1 = ( − 2 , 4 , − 3 ) T \alpha_2=\alpha_2-y_1=(-2,4,-3)^T α2=α2−y1=(−2,4,−3)T
α 3 = α 3 = ( 1 , − 5 , 0 ) T \alpha_3=\alpha_3=(1,-5,0)^T α3=α3=(1,−5,0)T
输入 y 2 y_2 y2,计算判别函数值:
g 1 ( y 2 ) = α 1 T y 2 = − 2 , g 2 ( y 2 ) = α 2 T y 2 = 1 , g 3 ( y 2 ) = α 3 T y 2 = − 8 g_1(y_2)=\alpha_1^Ty_2=-2,\:g_2(y_2)=\alpha_2^Ty_2=1,\:g_3(y_2)=\alpha_3^Ty_2=-8 g1(y2)=α1Ty2=−2,g2(y2)=α2Ty2=1,g3(y2)=α3Ty2=−8
g 2 > g 1 > g 3 g_2>g_1>g_3 g2>g1>g3,无需修正权值矢量;
输入
y
3
y_3
y3,计算判别函数值:
g
1
(
y
3
)
=
α
1
T
y
3
=
−
4
,
g
2
(
y
3
)
=
α
2
T
y
3
=
−
1
,
g
3
(
y
3
)
=
α
3
T
y
3
=
2
g_1(y_3)=\alpha_1^Ty_3=-4,\:g_2(y_3)=\alpha_2^Ty_3=-1,\:g_3(y_3)=\alpha_3^Ty_3=2
g1(y3)=α1Ty3=−4,g2(y3)=α2Ty3=−1,g3(y3)=α3Ty3=2
g
3
>
g
2
>
g
1
g_3>g_2>g_1
g3>g2>g1 ,无需修正权值矢量;
第三轮:
输入
y
1
y_1
y1,计算判别函数值:
g
1
(
y
1
)
=
α
1
T
y
1
=
1
,
g
2
(
y
1
)
=
α
2
T
y
1
=
−
1
,
g
3
(
y
1
)
=
α
3
T
y
1
=
−
4
g_1(y_1)=\alpha_1^Ty_1=1,\:g_2(y_1)=\alpha_2^Ty_1=-1,\:g_3(y_1)=\alpha_3^Ty_1=-4
g1(y1)=α1Ty1=1,g2(y1)=α2Ty1=−1,g3(y1)=α3Ty1=−4
g
1
>
g
2
>
g
3
g_1>g_2>g_3
g1>g2>g3,无需修正权值矢量;
分类器能够正确识别全部训练样本,输出权值矢量:
α
1
=
(
−
4
,
1
,
4
)
T
,
α
2
=
(
−
2
,
4
,
−
3
)
T
,
α
3
=
(
1
,
−
5
,
0
)
T
\alpha_1=(-4,1,4)^T,\alpha_2=(-2,4,-3)^T,\alpha_3=(1,-5,0)^T
α1=(−4,1,4)T,α2=(−2,4,−3)T,α3=(1,−5,0)T
对应三个类别的分类函数为:
g
1
(
x
)
=
−
4
x
1
+
x
2
+
4
,
g
2
(
x
)
=
−
2
x
1
+
4
x
2
−
3
,
g
3
(
x
)
=
x
1
−
5
x
2
g_1(x)=-4x_1+x_2+4,\quad g_2(x)=-2x_1+4x_2-3,\quad g_3(x)=x_1-5x_2
g1(x)=−4x1+x2+4,g2(x)=−2x1+4x2−3,g3(x)=x1−5x2
转换成一对一式的判别函数:
g
12
(
x
)
=
g
1
(
x
)
−
g
2
(
x
)
=
−
2
x
1
−
3
x
2
+
7
g_{12}(x)=g_1(x)-g_2(x)=-2x_1-3x_2+7
g12(x)=g1(x)−g2(x)=−2x1−3x2+7
g
13
(
x
)
=
g
1
(
x
)
−
g
3
(
x
)
=
−
5
x
1
+
6
x
2
+
4
g_{13}(x)=g_1(x)-g_3(x)=-5x_1+6x_2+4
g13(x)=g1(x)−g3(x)=−5x1+6x2+4
g
23
(
x
)
=
g
2
(
x
)
−
g
3
(
x
)
=
−
3
x
1
+
9
x
2
−
3
g_{23}(x)=g_2(x)-g_3(x)=-3x_1+9x_2-3
g23(x)=g2(x)−g3(x)=−3x1+9x2−3
题目 3
设两类样本的类内散布矩阵分别为 S 1 = [ 1 1 2 1 2 1 ] , S 2 = [ 1 − 1 2 − 1 2 1 ] S_1= \begin{bmatrix} 1& \frac{1}{2}\\ \frac{1}{2}& 1\end{bmatrix} , S_2= \begin{bmatrix} 1& - \frac{1}{2}\\ - \frac{1}{2}& 1\end{bmatrix} S1=[121211],S2=[1−21−211], 两类的类心分别为 m 1 = ( 2 , 0 ) T \mathbf{m} _{1}= ( 2, 0) ^{\mathrm{T} } m1=(2,0)T, m 2 = ( 2 , 2 ) T \mathbf{m} _{2}= ( 2, 2) ^{\mathrm{T} } m2=(2,2)T,试用 fisher 准则求其决策面方程。
解:
s
w
=
[
1
1
2
1
2
1
]
+
[
1
−
1
2
−
1
2
1
]
=
[
2
0
0
2
]
s_w=\begin{bmatrix}1&\frac{1}{2}\\\frac{1}{2}&1\end{bmatrix}+\begin{bmatrix}1&-\frac{1}{2}\\-\frac{1}{2}&1\end{bmatrix}=\begin{bmatrix}2&0\\0&2\end{bmatrix}
sw=[121211]+[1−21−211]=[2002]
S
w
−
1
=
[
1
2
0
0
1
2
]
S_w^{-1}=\begin{bmatrix}\frac{1}{2}&0\\0&\frac{1}{2}\end{bmatrix}
Sw−1=[210021]
投影方向为
W
=
S
w
−
1
(
m
1
−
m
2
)
=
[
1
2
0
0
1
2
]
(
0
−
2
)
=
(
0
−
1
)
W=S_w^{-1}(m_1-m_2)=\begin{bmatrix}\frac12&0\\0&\frac12\end{bmatrix}\begin{pmatrix}0\\-2\end{pmatrix}=\begin{pmatrix}0\\-1\end{pmatrix}
W=Sw−1(m1−m2)=[210021](0−2)=(0−1)
则决策面方程为
y
=
W
T
(
x
−
m
1
+
m
2
2
)
y=W^T\left(x-\frac{m_1+m_2}{2}\right)
y=WT(x−2m1+m2)
=(0
−
1
)
(
x
1
2
−
2
ˊ
x
2
−
1
)
- 1) \begin{pmatrix} x_1^2- \acute{2} \\ x_2- 1\end{pmatrix}
−1)(x12−2ˊx2−1)
=
−
x
2
+
1
=-x_{2}+1
=−x2+1
w
∗
=
S
w
−
1
(
m
1
−
m
2
)
=
[
1
−
1
−
1
]
则决策面方程为
y
=
w
∗
T
(
x
−
m
1
+
m
2
2
)
=
[
1
−
1
−
1
]
[
x
1
−
1
2
x
2
−
1
2
x
3
−
1
2
]
=
x
1
−
x
2
−
x
3
+
1
2
\begin{aligned} & w^{*}=S_{w}^{-1}(m_{1}-m_{2})= \begin{bmatrix} 1 \\ -1 \\ -1 \end{bmatrix} \\ & \text{则决策面方程为 }y=w^{*T}\left(x-\frac{m_1+m_2}{2}\right) \\ & = \begin{bmatrix} 1 & -1 & -1 \end{bmatrix} \begin{bmatrix} x_1-\frac{1}{2} \\ x_2-\frac{1}{2} \\ x_3-\frac{1}{2} \end{bmatrix} \\ & =x_1-x_2-x_3+\frac{1}{2} \end{aligned}
w∗=Sw−1(m1−m2)=
1−1−1
则决策面方程为 y=w∗T(x−2m1+m2)=[1−1−1]
x1−21x2−21x3−21
=x1−x2−x3+21
题目 4
x
1
1
=
[
0
,
0
,
0
]
T
,
x
1
2
=
[
1
,
0
,
0
]
T
,
x
1
3
=
[
1
,
0
,
1
]
T
,
x
1
4
=
[
1
,
1
,
0
]
T
x
2
1
=
[
0
,
0
,
1
]
T
,
x
2
2
=
[
0
,
1
,
0
]
T
,
x
2
3
=
[
0
,
1
,
1
]
T
,
x
2
4
=
[
1
,
1
,
1
]
T
x_{1}^{1}=[0,0,0]^{T}\:,\quad x_{1}^{2}=[1,0,0]^{T}\:,\quad x_{1}^{3}=[1,0,1]^{T}\:,\quad x_{1}^{4}=[1,1,0]^{T}\\x_{2}^{1}=[0,0,1]^{T}\:,\quad x_{2}^{2}=[0,1,0]^{T}\:,\quad x_{2}^{3}=[0,1,1]^{T}\:,\quad x_{2}^{4}=[1,1,1]^{T}
x11=[0,0,0]T,x12=[1,0,0]T,x13=[1,0,1]T,x14=[1,1,0]Tx21=[0,0,1]T,x22=[0,1,0]T,x23=[0,1,1]T,x24=[1,1,1]T
使用Fisher线性判别方法给出这两类样本的分类面。
解析:
m
1
=
[
0.75
0.25
0.25
]
m
2
=
[
0.25
0.75
0.75
]
m_1=\begin{bmatrix}0.75\\0.25\\0.25\end{bmatrix}\quad m_2=\begin{bmatrix}0.25\\0.75\\0.75\end{bmatrix}
m1=
0.750.250.25
m2=
0.250.750.75
S
1
=
∑
i
=
1
4
(
x
i
−
m
1
)
(
x
i
−
m
1
)
T
=
[
9
16
3
16
3
16
3
16
1
16
1
16
3
16
1
16
1
16
]
+
[
1
16
−
1
16
−
1
16
1
16
1
16
1
16
−
1
16
1
16
1
16
]
+
[
1
16
−
1
16
3
16
−
1
16
1
16
−
3
16
3
16
−
3
16
9
16
]
\begin{gathered}S_{1}=\sum_{i=1}^{4}(x_{i}-m_{1})(x_{i}-m_{1})^{T}=\begin{bmatrix}\dfrac{9}{16}&\dfrac{3}{16}&\dfrac{3}{16}\\\dfrac{3}{16}&\dfrac{1}{16}&\dfrac{1}{16}\\\dfrac{3}{16}&\dfrac{1}{16}&\dfrac{1}{16}\end{bmatrix}+\begin{bmatrix}\dfrac{1}{16}&-\dfrac{1}{16}&-\dfrac{1}{16}\\\dfrac{1}{16}&\dfrac{1}{16}&\dfrac{1}{16}\\-\dfrac{1}{16}&\dfrac{1}{16}&\dfrac{1}{16}\end{bmatrix}+\begin{bmatrix}\dfrac{1}{16}&-\dfrac{1}{16}&\dfrac{3}{16}\\-\dfrac{1}{16}&\dfrac{1}{16}&-\dfrac{3}{16}\\\dfrac{3}{16}&-\dfrac{3}{16}&\dfrac{9}{16}\end{bmatrix}\end{gathered}
S1=i=1∑4(xi−m1)(xi−m1)T=
169163163163161161163161161
+
161161−161−161161161−161161161
+
161−161163−161161−163163−163169
+
[
1
16
3
16
−
1
16
3
16
9
16
−
3
16
−
1
16
−
3
16
1
16
]
=
[
3
4
1
4
1
4
1
4
3
4
−
1
4
1
4
−
1
4
3
4
]
\begin{aligned}+\begin{bmatrix}\dfrac{1}{16}&\dfrac{3}{16}&-\dfrac{1}{16}\\\dfrac{3}{16}&\dfrac{9}{16}&-\dfrac{3}{16}\\-\dfrac{1}{16}&-\dfrac{3}{16}&\dfrac{1}{16}\end{bmatrix}=\begin{bmatrix}\dfrac{3}{4}&\dfrac{1}{4}&\dfrac{1}{4}\\\dfrac{1}{4}&\dfrac{3}{4}&-\dfrac{1}{4}\\\dfrac{1}{4}&-\dfrac{1}{4}&\dfrac{3}{4}\end{bmatrix}\end{aligned}
+
161163−161163169−163−161−163161
=
4341414143−4141−4143
S
2
=
∑
i
=
1
4
(
x
i
−
m
2
)
(
x
i
−
m
2
)
T
=
[
1
16
3
16
−
1
16
3
16
9
16
−
3
16
−
1
16
−
3
16
1
16
]
+
[
1
16
−
1
16
3
16
−
1
16
1
16
−
3
16
3
16
−
3
16
9
16
]
S_{2}=\sum_{i=1}^{4}(x_{i}-m_{2})(x_{i}-m_{2})^{T}=\begin{bmatrix}\dfrac{1}{16}&\dfrac{3}{16}&-\dfrac{1}{16}\\\dfrac{3}{16}&\dfrac{9}{16}&-\dfrac{3}{16}\\-\dfrac{1}{16}&-\dfrac{3}{16}&\dfrac{1}{16}\end{bmatrix}+\begin{bmatrix}\dfrac{1}{16}&-\dfrac{1}{16}&\dfrac{3}{16}\\-\dfrac{1}{16}&\dfrac{1}{16}&-\dfrac{3}{16}\\\dfrac{3}{16}&-\dfrac{3}{16}&\dfrac{9}{16}\end{bmatrix}
S2=i=1∑4(xi−m2)(xi−m2)T=
161163−161163169−163−161−163161
+
161−161163−161161−163163−163169
+
[
1
16
−
1
16
−
1
16
−
1
16
1
16
1
16
−
1
16
1
16
1
16
]
+
[
9
16
3
16
3
16
3
16
1
16
1
16
3
16
1
16
1
16
]
=
[
3
4
1
4
1
4
1
4
3
4
−
1
4
1
4
−
1
4
3
4
]
+\begin{bmatrix}\dfrac{1}{16}&-\dfrac{1}{16}&-\dfrac{1}{16}\\-\dfrac{1}{16}&\dfrac{1}{16}&\dfrac{1}{16}\\-\dfrac{1}{16}&\dfrac{1}{16}&\dfrac{1}{16}\end{bmatrix}+\begin{bmatrix}\dfrac{9}{16}&\dfrac{3}{16}&\dfrac{3}{16}\\\dfrac{3}{16}&\dfrac{1}{16}&\dfrac{1}{16}\\\dfrac{3}{16}&\dfrac{1}{16}&\dfrac{1}{16}\end{bmatrix}=\begin{bmatrix}\dfrac{3}{4}&\dfrac{1}{4}&\dfrac{1}{4}\\\dfrac{1}{4}&\dfrac{3}{4}&-\dfrac{1}{4}\\\dfrac{1}{4}&-\dfrac{1}{4}&\dfrac{3}{4}\end{bmatrix}
+
161−161−161−161161161−161161161
+
169163163163161161163161161
=
4341414143−4141−4143
S
w
=
(
S
1
+
S
2
)
=
1
2
[
3
1
1
1
3
−
1
1
−
1
3
]
S
w
−
1
=
(
1
−
1
2
−
1
2
−
1
2
1
1
2
−
1
2
1
2
1
)
S_w=\quad(S_1+S_2)=\dfrac{1}{2}\begin{bmatrix}3&1&1\\1&3&-1\\1&-1&3\end{bmatrix}\quad S_w^{-1}=\begin{pmatrix}1&-\dfrac{1}{2}&-\dfrac{1}{2}\\-\dfrac{1}{2}&1&\dfrac{1}{2}\\-\dfrac{1}{2}&\dfrac{1}{2}&1\end{pmatrix}
Sw=(S1+S2)=21
31113−11−13
Sw−1=
1−21−21−21121−21211
w ∗ = S w − 1 ( m 1 − m 2 ) = [ 1 − 1 − 1 ] , y 0 = w ∗ T m 1 + w ∗ T m 2 2 = − 1 2 w^*=S_w^{-1}(m_1-m_2)=\begin{bmatrix}1\\-1\\-1\end{bmatrix},\quad y_0=\frac{w^{*T}m_1+w^{*T}m_2}{2}=-\frac{1}{2} w∗=Sw−1(m1−m2)= 1−1−1 ,y0=2w∗Tm1+w∗Tm2=−21
则决策面方程为 w ∗ T x − y 0 w^{*T}x-y_0 w∗Tx−y0
= ∣ x 1 x 2 x 3 ∣ + 1 2 \begin{vmatrix} x_{1}\\ x_{2}\\ x_{3}\end{vmatrix} + \frac 12 x1x2x3 +21
= x 1 − x 2 − x 3 + 1 2 =x_{1}-x_{2}-x_{3}+\frac{1}{2} =x1−x2−x3+21
决策面方程为 0 = w ∗ T ( x − m 1 + m 2 2 ) 0=w^*T\left(x-\frac{m_1+m_2}2\right) 0=w∗T(x−2m1+m2)
= [ x 1 − 1 2 x 2 − 1 2 x 3 − 1 2 ] \begin{bmatrix} x_1- \frac 12\\ x_2- \frac 12\\ x_3- \frac 12\end{bmatrix} x1−21x2−21x3−21
= x 1 − x 2 − x 3 + 1 2 =x_{1}-x_{2}-x_{3}+\frac{1}{2} =x1−x2−x3+21
或者也可以写为
决策面方程为
w
∗
T
(
x
−
m
1
+
m
2
2
)
=
[
1
−
1
−
1
]
[
x
1
−
1
2
x
2
−
1
2
x
3
−
1
2
]
=
x
1
−
x
2
−
x
3
+
1
2
\begin{aligned}\text{决策面方程为 }&w^{*T}\left(x-\frac{m_{1}+m_{2}}{2}\right)\\&=\begin{bmatrix}1&-1&-1\end{bmatrix}\begin{bmatrix}x_1-\frac12\\x_2-\frac12\\x_3-\frac12\end{bmatrix}\\&=x_1-x_2-x_3+\frac12\end{aligned}
决策面方程为 w∗T(x−2m1+m2)=[1−1−1]
x1−21x2−21x3−21
=x1−x2−x3+21
题目 5
4.5.对于样本空间中的一划分超平面 w T w^T wTx + b = 0 +b=0 +b=0,有 w T = ( − 1 , 3 , 2 ) w^T= ( - 1, 3, 2) wT=(−1,3,2),b= 1, 则判断向量(4.-2.2)、(2.5.-6.5)、(4.-2.4) 是否为支持向量,并求出间隔。
解析
- 公式如下
y i [ ( w T ⋅ x i ) + b ] = 1 { ( w T ⋅ x i ) + b = 1 , y i = + 1 ( w T ⋅ x i ) + b = − 1 , y i = − 1 M = 2 ∥ w ∥ \begin{gathered} y_i[(w^T\cdot x_i)+b]=1 \\ \begin{cases} \left(w^T\cdot x_i\right)+b=1,y_i=+1 \\ \left(w^T\cdot x_i\right)+b=-1,y_i=-1 & \end{cases} \\ \mathrm{M}=\frac{2}{\|w\|} \end{gathered} yi[(wT⋅xi)+b]=1{(wT⋅xi)+b=1,yi=+1(wT⋅xi)+b=−1,yi=−1M=∥w∥2
解 : 最大间隔为 : d = 2 ∣ ∣ w ∣ ∣ = 2 1 + 9 + 4 = 14 7 判断向量是否为支持向量 ① x 1 = ( 4 , − 2 , 2 ) W T x 1 + b = − 4 − 6 + 4 + 1 = 5 > 1 x 1 不是支持向量 ② x 2 = ( 2 , 5 , − 6.5 ) W 7 x 2 + b = − 2 + 15 − 13 + 1 = 1 x 2 是支持向量 . ③ x 3 = ( 4 , − 2 , 4 ) w T x 3 + b = − 4 − 6 + 8 + 1 = − 1 x 3 是支持向量 \begin{aligned} 解: \\ & 最大间隔为:d=\frac{2}{||w||}=\frac{2}{\sqrt{1+9+4}}=\frac{\sqrt{14}}{7} \\ & 判断向量是否为支持向量 \\ & ①x_{1}=(4,-2,2) \\ & W^{T}x_{1}+b=-4-6+4+1=5>1 \\ & x_{1}不是支持向量 \\ & ②x_{2}=(2,5,-6.5) \\ & W^{7}x_{2}+b=-2+15-13+1=1 \\ & x_{2}是支持向量 \\ & \mathrm{.}③x_{3}=(4,-2,4) \\ & w^{T}x_{3}+b=-4-6+8+1=-1 \\ & x_{3}是支持向量 \end{aligned} 解:最大间隔为:d=∣∣w∣∣2=1+9+42=714判断向量是否为支持向量①x1=(4,−2,2)WTx1+b=−4−6+4+1=5>1x1不是支持向量②x2=(2,5,−6.5)W7x2+b=−2+15−13+1=1x2是支持向量.③x3=(4,−2,4)wTx3+b=−4−6+8+1=−1x3是支持向量