Chapter3-线性模型线性模型

这篇博客介绍了线性模型在回归和分类任务中的应用。线性回归用于简单回归,利用最小二乘法求解。对数几率回归连接了回归与分类,适用于概率预测。LDA线性判别分析则通过最大化类间散度和最小化类内散度进行分类,可用于降维。类别不平衡问题通过阈值调整、欠采样和过采样等方法处理。

Chapter3-线性模型线性模型

试图学得一个通过对属性线性组合来进行预测的函数,基本形式如下:f(x)=wTx+b f(x) = w^T x + bf(x)=wTx+b确定了 wwwbbb,则模型就确定下来。优点:形式简单,易于建模;可解释性强:www 表达了各个属性在预测中的重要性。## 线性回归我们可以用线性模型来做简单的回归任务,即根据样本的属性预测样本的标签值。均方误差是回归任务中常用的性能度量,其几何意义是欧几里得距离。基于均方误差求解的方法即为最小二乘法,目标是找出一条直线使所有样本到直线距离之和最小。广义线性模型:y=g−1(wTx+b) y = g^{-1}(w^Tx+b)y=g1(wTx+b)其中 g(⋅)g(\cdot)g() 连续且充分光滑,g(⋅)=ln(⋅)g(\cdot) = ln(\cdot)g()=ln() 则为对数线性回归。 ## 对数几率回归将回归任务和分类任务连接起来的,是对数几率函数:σ(x)=11+e−x\sigma(x) = \frac{1}{1 +e ^{-x}}σ(x)=1+ex1易得:lny1−y=wTx+b ln \frac{y}{1-y} = w^T x+ bln1yy=wTx+b 解释:$y $ 为正例的概率, 1−y1-y1y 为反例的可能性,二者的比值 y1−y\frac{y}{1-y}1yy 称为几率(odds),反应了 xxx 作为正例的相对可能性,取对数即为对数几率函数。实际上,我们是用线性回归的预测结果去逼近真实标记的对数几率。
优点:1. 直接对分类可能性进行建模,无需假设数据分布,避免了假设不正确带来的问题
2. 不仅预测出类别,同时得到近似概率预测
3. 对数几率函数任意阶可导,便于求解

LDA线性判别分析(Linear Discriminant Analysis)

是一种经典的线性学习方法,其思想是:给定训练集,将样本投影到一条直线上,使得同类别样本的投影点尽可能接近、不同类别的投影点尽可能远离;对新样本进行预测时,先进行投影,再根据投影点进行预测。最大化目标(以二分类为例):

  1. 定义类内散度距离 SwS_wSw 为:第 0 类样本距离 0 类中心的距离之和 + 第 1 类样本距离第 1 类中心的距离之和2. 定义类间散度距离 SbS_bSb 为:第 0 类中心和第 1 类中心的距离3. 最大化:$ J = \frac{wTS_bw}{wTS_ww}$,即 SbS_bSbSwS_wSw 的广义瑞利商(PS:不知道和大物的瑞利判据有没有什么关系)求解 www 的方法:解与 www 长度无关,只关乎其方向(投影到直线上,www 决定其方向),使用拉格朗日乘子法解得:w=Sw−1(μ0−μ1) w = S_w^{-1}(\mu_0 - \mu_1)w=Sw1(μ0μ1) u0u_0u0μ1\mu_1μ1 为两个类别中心,实作中考虑到数值稳定性先对 SwS_wSw 进行奇异值分解得到 Sw=UΣUTS_w = U\Sigma U^TSw=UΣUT 后再通过 Sw−1=UΣ−1UTS_w^{-1} = U\Sigma^{-1} U^TSw1=UΣ1UT 求得。推广到多分类中:1. 修改类内散度 SwS_wSw 为各个类别距离该类中心距离之和(2 -> N)
  2. 类间散度 $ S_b$ :各个类到样本中心距离之和 StS_tSt - 类内散度SwS_wSw 通过找到 W 来 maximize tr(WTSbW)tr(WTSwW)\frac{tr(W^TS_bW)}{tr(W^TS_wW)}tr(WTSwW)tr(WTSbW) 完成多分类任务,其闭式解为 Sw−1SbS_w^{-1}S_bSw1Sbd′d'd 个最大非零广义特征值对应的特征向量构成的矩阵(PS:没看懂)若将 WWW 视作一个投影矩阵,那么 LDA 事实上将样本投影到 d′d'd 维空间,d′d'd 通常小于原有属性数目 ddd。因此,LDA 同时也成为一种经典的监督将为技术,来将高维向量投影至低维空间并保留其部分类别信息(Word Embedding 的可视化就可以使用 LDA)。

多分类学习一些二分类学习方法可以直接推广到多分类,比如 LDA,但在很多情况下,我们会将多分类问题转化为二分类进而来解决。如何转化,或者说将多分类任务拆分为多个二分类任务是关键。

最经典的拆分策略有三种:OvO(一对一)、OvR(一对其余)以及MvM(多对多)。

  1. OvO:将 N 个类别两两配对(这个表示戳中萌点2333),产生 N(N-1)/2 个分类器,使用这些分类器对样本进行预测,最终结果通过投票产生:取预测得最多的类别作为分类结果。(PS:这个表示好萌啊)
  2. OvR:每次将一个类作为正例,剩余作为反例,训练 N 个分类器,测试时若只有一个分类器预测为正例,则类别为该分类器对应为正例的类别;若有多个,根据置信度来挑选。
  3. MvM:若干个类别作为正例,若干个作为反例,其构造需要有特殊的设计,常用的技术有纠错输出码。 1. 编码: 对 N 个类别做 M 次划分,每次划分一部分作为正类一部分反类,得到 M 个训练集和 M 个分类器 2. 解码:用 M 个分类器进行预测,预测表及组成一个编码,用该编码和类别编码进行比较,返回距离最小的作为结果## 类别不平衡的处理方法训练集中的样本类别数目如果有较大差距,对于学习会产生很大影响,例如,10000 样本中 只有 2 个反例,那么即使预测全为正例的分类器也能达到 99.8% 的准确率,但是这没有任何意义。这种情况就称之为类别不平衡(class-imbalance)。根据之前的内容,我们可以得到,分类器分类的是用预测的 yyy 值同一个阈值进行比较,若大于阈值则判定为正例,反之为反例。比如,阈值设置为 0.5,即认为正例和反例出现可能性相同,即$ \frac{y}{1-y} > 1$ 时判定为正例。但是类别不平衡时,假设正例数目为 m+m^+m+,反例为 m−m^-m,则观测几率为 m+m−\frac{m^+}{m^-}mm+。若我们认为训练集是对真实样本的无偏采样,则观测几率代表真实几率。于是,当正例出现的相对几率大于真实几率时,判定为正例,即:y1−y>m+m− \frac{y}{1-y} > \frac{m^+}{m^-}1yy>mm+我们通过使用再平衡(rescaling), 来把右侧的这个 1 调整为观测几率:$ \frac{y’}{1-y’} = \frac{y}{1-y} \times \frac{m+}{m-}$这种手段称之为阈值移动还有两种通过人为改变训练集的类别比例来消除类别不平衡的影响的手段:4. 欠采样(undersampling):去除一些出现较多的类别的样本,使得两个类别数目相近5. 过采样(oversampling):增加一些出现较少的类别的样本注意点:1. 欠采样速度比过采样快,因为一个是减小训练集一个是增加2. 过采样不能简单的重复采样,否则会产生严重的过拟合3. 欠采样的丢弃可能会造成信息的丢失
内容概要:本文介绍了ENVI Deep Learning V1.0的操作教程,重点讲解了如何利用ENVI软件进行深度学习模型的训练与应用,以实现遥感图像中特定目标(如集装箱)的自动提取。教程涵盖了从数据准备、标签图像创建、模型初始化与训练,到执行分类及结果优化的完整流程,并介绍了精度评价与通过ENVI Modeler实现一键化建模的方法。系统基于TensorFlow框架,采用ENVINet5(U-Net变体)架构,支持通过点、线、面ROI或分类图生成标签数据,适用于多/高光谱影像的单一类别特征提取。; 适合人群:具备遥感图像处理基础,熟悉ENVI软件操作,从事地理信息、测绘、环境监测等相关领域的技术人员或研究人员,尤其是希望将深度学习技术应用于遥感目标识别的初学者与实践者。; 使用场景及目标:①在遥感影像中自动识别和提取特定地物目标(如车辆、建筑、道路、集装箱等);②掌握ENVI环境下深度学习模型的训练流程与关键参数设置(如Patch Size、Epochs、Class Weight等);③通过模型调优与结果反馈提升分类精度,实现高效自动化信息提取。; 阅读建议:建议结合实际遥感项目边学边练,重点关注标签数据制作、模型参数配置与结果后处理环节,充分利用ENVI Modeler进行自动化建模与参数优化,同时注意软硬件环境(特别是NVIDIA GPU)的配置要求以保障训练效率。
内容概要:本文系统阐述了企业新闻发稿在生成式引擎优化(GEO)时代下的全渠道策略与效果评估体系,涵盖当前企业传播面临的预算、资源、内容与效果评估四大挑战,并深入分析2025年新闻发稿行业五大趋势,包括AI驱动的智能化转型、精准化传播、首发内容价值提升、内容资产化及数据可视化。文章重点解析央媒、地方官媒、综合门户和自媒体四类媒体资源的特性、传播优势与发稿策略,提出基于内容适配性、时间节奏、话题设计的策略制定方法,并构建涵盖品牌价值、销售转化与GEO优化的多维评估框架。此外,结合“传声港”工具实操指南,提供AI智能投放、效果监测、自媒体管理与舆情应对的全流程解决方案,并针对科技、消费、B2B、区域品牌四大行业推出定制化发稿方案。; 适合人群:企业市场/公关负责人、品牌传播管理者、数字营销从业者及中小企业决策者,具备一定媒体传播经验并希望提升发稿效率与ROI的专业人士。; 使用场景及目标:①制定科学的新闻发稿策略,实现从“流量思维”向“价值思维”转型;②构建央媒定调、门户扩散、自媒体互动的立体化传播矩阵;③利用AI工具实现精准投放与GEO优化,提升品牌在AI搜索中的权威性与可见性;④通过数据驱动评估体系量化品牌影响力与销售转化效果。; 阅读建议:建议结合文中提供的实操清单、案例分析与工具指南进行系统学习,重点关注媒体适配性策略与GEO评估指标,在实际发稿中分阶段试点“AI+全渠道”组合策略,并定期复盘优化,以实现品牌传播的长期复利效应。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值