间隔的直观理解

1. 间隔的直观理解

这一章从“间隔”这个概念开始讲述SVM(支持向量机)模型。本文会以实际的例子让读者对于“间隔”的概念有一个更清晰直观的理解。我们会将前两节总结的思想在第三节通过数学语言来描述。

对于logistic分类模型,由公式 hθ(x)=g(θTx) 计算条件概率 p(y=1|x;θ) 。只有在 hθ(x)0.5 我们会预测y=1,等价于 θTx0 时y=1。对单个正样本(y=1)而言, θTx 的值越大,条件概率 p(y=1|x;θ) 就越大,那我们就更“确信”这个样本标记为1。这样模型就有一个很好的优化方向,寻找参数 θ 使得当 y(i)=1 θTx>>0 ,同理当 y(i)=0 时使 θTx<<0 ,这反映我们对训练样本分类结果的确定性。我们将会通过函数间隔来刻画这个思想。

注意看下面这张图,叉叉代表正样本,圆圈代表负样本。我们画出了一条决策线(也可称为分离超平面,其上的点满足 θTx=0 )。我们标出了三个示范点A、B、C。

这里写图片描述

可以很容易的发现A点离决策线很远,而C点离决策线很近。我们可以很有信心的说A是一个正样本(y=1),但C点就不太确定了,决策线的参数只需稍有改变,C点就极有可能变成负样本(y=0)。B点相对决策线的距离在A、C之间,我们对它的确信度也在A、C之间。整理一下思路,我们需要找到一条直线使得直线两边的点到它的距离都尽可能的远,这样我们才能确信自己的判断。我们之后会以物理间隔这个概念来描述此问题。

标记符

之后支持向量机的讨论中,我们将使用一组新的标记符。对于二分类问题中的线性分类器,标注记为 y ,特征为x。我们令y的值域为 y{1,1} (而非 {0,1} )。同时模型参数的标记从向量 θ 变为 w,b 。公式即改写为:

hw,b(x)=g(wTx+b)

对于函数 g ,当z0 g(z)=1 ,当 z0 g(z)=1 。当前 w,b 组合的标记符有利于我们将截距项 b 从众多参数中分离出来。
还有一点需要注意,从函数g的定义可以看出这个分类器会直接预测1或-1,这一点和感知器模型是一致的。而不是像logisitc分类器先求解y=1的条件概率 P(y=1|θ;x) 后再做判断。

函数间隔和物理间隔

这一节将正式给出函数间隔和物理间隔的数学定义。对某一给定训练样本 (x(i),y(i)) ,我们定义其函数间隔为

γ^(i)=y(i)(wTx(i)+b)

从上式可以看出,当 y(i)=1 时要使函数间隔变大,只需增大 wTx+b 。同理当 y(i)=1 只需减小 wTx+b 函数间隔就会增大。同时当 y(i)(wTx(i)+b)0 即代表我们预测正确。因此足够大的函数间隔表示这是一个置信度很高的正确预测。

对于某一给定训练集 S={(x(i),y(i));i=1,,m} ,我们定义训练集中最小函数间隔记为 γ^

γ^=mini=1,,mγ^(i)

但是用函数间隔描述置信度存在一个问题,如果我们将参数从 (w,b) 替换成 (2w,2b) 那么函数间隔会扩大一倍,但实际并不能增加置信度。直觉告诉我们,这里可能需要有一个归一化条件比如 w2=1 ,将 (w,b) 替换成 (w/w2,b/w2) 再来计算函数间隔,这就引出了几何间隔的概念。我们接下来讨论几何间隔,看下图:

这里写图片描述

我们画出了决策线,易见 w 同决策线正交(垂直)。点A是一个输入为x(i)标记为 y(i)=1 的正样本。它到决策线的距离 γ(i) 就是线段AB。我们如何确定 γ(i) 的数值呢?首先 w/w w 的单位向量,点A的坐标为x(i)那么点B的坐标可表示为 x(i)γ(i)w/w ,又点B在决策线上则有:

wT(x(i)γ(i)ww)+b=0

求解方程得:

γ(i)=wTx(i)+bw=(ww)Tx(i)+bw.

这就是几何间隔的数学公式。当 w=1 时,几何间隔和函数间隔相等。从公式中可以发现参数的缩放不会影响几何间隔的大小。

最后,对于某一给定训练集 S={(x(i),y(i));i=1,,m} ,我们定义训练集中最小几何间隔记为 γ

γ=mini=1,,mγ(i)

本文主要内容来自吴恩达老师网易公开课机器学习中的课件,本人自行翻译并重新对文章进行编辑排版,转载请注明出处

### 纹理特征的概念及其直观理解 #### 什么是纹理特征? 在计算机视觉和图像处理领域,纹理特征是指用于描述图像局部区域表面特性的量化指标。它能够捕捉图像中的重复性结构或模式,例如颜色分布、亮度变化以及空间频率特性等[^1]。这种特征通常被用来区分不同类型的材料或者物体表面。 #### 直观理解纹理特征 为了更好地理解纹理特征,可以从以下几个方面入手: - **灰度级差异**:如果张图片具有明显的明暗交替现象,则说明该图具备较高的对比度纹理;反之则可能属于低频平滑型纹理。 - **方向性和周期性**:某些特定材质(如织物纤维)会在定方向上呈现出规律排列的趋势,这便是所谓的方向性纹理表现形式之。而当这些条纹按照固定间隔反复出现时就形成了所谓的周期性纹理[^2]。 以下是利用Python实现基于GLCM(Gray-Level Co-occurrence Matrix, 灰度共生矩阵)计算几种典型纹理属性的例子: ```python import numpy as np from skimage.feature import greycomatrix, greycoprops # 创建个简单的二值化图像作为例子 img = np.array([[0, 0, 1, 1], [0, 0, 1, 1], [0, 2, 2, 2], [2, 2, 3, 3]], dtype=np.uint8) distances = [1, 2, 3] angles = [0, np.pi/4, np.pi/2, 3*np.pi/4] glcm = greycomatrix(img, distances=distances, angles=angles, levels=4, symmetric=True, normed=True) contrast = greycoprops(glcm, 'contrast') dissimilarity = greycoprops(glcm, 'dissimilarity') print(f"Contrast:\n{contrast}") print(f"Dissimilarity:\n{dissimilarity}") ``` 上述代码片段展示了如何构建并分析灰度共生矩阵(GLCM),进而获取诸如对比度(constrast) 和不相似度(dissimilarity)这样的统计量来表征给定输入数据集内的纹理信息。
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值