机器学习基石第十周笔记

一.Logistic Regression Problem
我们之前讲解的二元分类只是判定输入是与不是,如下:
这里写图片描述
但是我们现在不止想知道是与不是,而是想知道是的几率和不是的几率,那我们该怎么办呢?这时我们就用到了逻逻辑斯回归(我们称之为软分类):
这里写图片描述
我们要想学得上述所说的东西,那么我们学习所需要的资料应该如下图左边所示(虽然标注为nioseless,其实我们知道我们的学习数据都是有noise的,这里的noiseless只是相对于右边),但是我们只有右边有杂讯的学习资料(我们把右边的学习资料归因为左边的加上杂讯所得到的的资料)
这里写图片描述
有了学习资料,我们还需要假设空间。
我们将输入数据的加权和作为该输入的分数,该分数越高我们就认为该数据的输出越接近1。然后我们用逻辑函数将该分数归一化到0,1之间,最后得到的结果就是我们的预测概率。
这里写图片描述
我们使用的逻辑函数性质如下:
这里写图片描述
这里写图片描述

二.Logistic Regression Error
有了假设空间后,我们就需要一个错误函数帮助我们从H中选取一个好的h,我们先将我们之前讲述的两个错误函数通过图像的方式给出来:
这里写图片描述
我们的目标函数f(x)估算的结果为P(+1|X)即给定X其为1的概率,反过来我们就能得到一个P(y|x)的分段函数,我们用f(x)产生我们学习数据的概率如下图中左部分所示,P(x1)f(x1)为第一个数据为x1且其y为1的概率,P(x2)(1-f(x2))为第二个数据为X2且其y为0的概率,x1.x2…..xN相互独立,其乘积就是获取整个学习数据D的概率,我们用假设空间的h(x)同样对输入X产生一组和输入空间相同的数据这时我们通过同样的计算也获取了获得该数据的概率,如果这两个概率很接近,那么我们就有理由说h(x)就是f(x)。
那么我们怎么才能判定他们的概率接近呢?由于数据集合D是真实存在的且其是由f(x)采样产生的,所以由f(x)采样产生D的概率最大,我们我们认为h(x)采样获取D的概率越大越接近f(x).
这里写图片描述
接下来我们要做的就是求出h(x)获取D的概率了,根据逻辑函数的性质我们得到下图的式子:
由于P(xi)概率都一样相当于常数,我们于是将P(xi)提出并用yn对Xi进行正负号的标记
这里写图片描述
我们得到如下式子:
这里写图片描述
然后将h(x)替换成其θ(ynW(T)Xn)即变成w的函数,因为我们最后要求的就是w。
这里写图片描述
然后为了方便求导我们对式子取Ln(不影响最终结果)将连乘变为连加,为了方便求解凸函数我们将式子反号并且将max变为min,同时将式子除了N(不影响结果),最后如下:
这里写图片描述

三.Gradient of Logistic Regression
上面求出了错误函数,那么下一步就是想办法让上述的错误函数最小求出我们的g了,我们发现错误函数是个凸函数所以我们能够通过求导等于0的方法求出我们要的那么最小错误所对应的W值。
这里写图片描述
我们首先对Wi即W向量的单个数据进行求导,然后推出对W的求导,下图的Xn,i代表Xn的第i个元素。最后的Xn为一个向量,每个向量只有一个元素即Xn,i.
这里写图片描述
我们令导数等于0,我们发现导数为θ函数的加权和,权值为(-YnXn),Ein(W)等于0的一种情况是θ函数全等于0,这就意味着θ的变量是一个负无穷大即YnW(T)Xn全部大于0即所有数据都线型可分,但是这经常是不可能的,所以情况只能是加权和为0。但是这里我们又不能像之前线型回归一样有闭式解,直接一步到位,搜哟我们只能参考PLA的求解形式即一步步对结果进行修正。
这里写图片描述
接下来我们回顾下PLA的求解方式:
这里写图片描述
这里写图片描述
这里写图片描述
四.Gradient Descent
接下来就介绍我们熟悉的梯度下降法了
我觉得这里讲的比其他地方的好很多
根据PLA的姐姐方法,我的的求解方程应为
W(t+1)<——Wt+nV;
这里的V为纠正错误的某个向量我们要求其模为1,n是每次更新的幅度。
这里的物理意义就是朝着正确的方向改变W从而使Ein不断的向谷底的方向接近。
这里写图片描述
上面的想法虽然很好但是奈何我们不知道这个V到底是什么,所以现在我们的关键是求V。
我们令nV很小然后再Wt处进行一阶泰勒展开,得到如下的公式。
这里写图片描述
我们现在要做的就是让在每次更新后Ein会变小。
我们要让Ein(Wt)加上后面的那一项后变小,那么V与δEin(Wt)的方向必须反向,因为只有反向的两个向量的乘积才是负数。又因为我们规定V必须是单位向量,所以得到V如下。
这里写图片描述
接下来我们要做的就是决定η的大小,就是我们每次更新的幅度。
如果我们的η太小,那么每次更新会很慢,就得花费额外的很多时间,如果η很大,那么每次跨太大步,就会把最佳的低点跨过去,那么就会在谷底附近形成震荡,所以我们希望当距谷底远时η大些,当离谷底近了η就小点,所以η与梯度成正比。
这里写图片描述
我们将η与梯度的比值定为一个常数计做紫色的η带入原式就得到了下图所示的最终算式。
这里写图片描述
这里写图片描述
上述算法步骤总结如下:
这里写图片描述

内容概要:本文围绕直流微电网中带有恒功率负载(CPL)的DC/DC升压转换器的稳定控制问题展开研究,提出了一种复合预设性能控制策略。首先,通过精确反馈线性化技术将非线性不确定的DC转换器系统转化为Brunovsky标准型,然后利用非线性扰动观测器评估负载功率的动态变化和输出电压的调节精度。基于反步设计方法,设计了具有预设性能的复合非线性控制器,确保输出电压跟踪误差始终在预定义误差范围内。文章还对比了多种DC/DC转换器控制技术如脉冲调整技术、反馈线性化、滑模控制(SMC)、主动阻尼法和基于无源性的控制,并分析了它们的优缺点。最后,通过数值仿真验证了所提控制器的有效性和优越性。 适合人群:从事电力电子、自动控制领域研究的学者和工程师,以及对先进控制算法感兴趣的研究生及以上学历人员。 使用场景及目标:①适用于需要精确控制输出电压并处理恒功率负载的应用场景;②旨在实现快速稳定的电压跟踪,同时保证系统的鲁棒性和抗干扰能力;③为DC微电网中的功率转换系统提供兼顾瞬态性能和稳态精度的解决方案。 其他说明:文中不仅提供了详细的理论推导和算法实现,还通过Python代码演示了控制策略的具体实现过程,便于读者理解和实践。此外,文章还讨论了不同控制方法的特点和适用范围,为实际工程项目提供了有价值的参考。
内容概要:该论文介绍了一种名为偏振敏感强度衍射断层扫描(PS-IDT)的新型无参考三维偏振敏感计算成像技术。PS-IDT通过多角度圆偏振光照射样品,利用矢量多层光束传播模型(MSBP)和梯度下降算法迭代重建样品的三维各向异性分布。该技术无需干涉参考光或机械扫描,能够处理多重散射样品,并通过强度测量实现3D成像。文中展示了对马铃薯淀粉颗粒和缓步类动物等样品的成功成像实验,并提供了Python代码实现,包括系统初始化、前向传播、多层传播、重建算法以及数字体模验证等模块。 适用人群:具备一定光学成像和编程基础的研究人员,尤其是从事生物医学成像、材料科学成像领域的科研工作者。 使用场景及目标:①研究复杂散射样品(如生物组织、复合材料)的三维各向异性结构;②开发新型偏振敏感成像系统,提高成像分辨率和对比度;③验证和优化计算成像算法,应用于实际样品的高精度成像。 其他说明:PS-IDT技术相比传统偏振成像方法具有明显优势,如无需干涉装置、无需机械扫描、可处理多重散射等。然而,该技术也面临计算复杂度高、需要多角度数据采集等挑战。文中还提出了改进方向,如采用更高数值孔径(NA)物镜、引入深度学习超分辨率技术等,以进一步提升成像质量和效率。此外,文中提供的Python代码框架为研究人员提供了实用的工具,便于理解和应用该技术。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值