
统计学
文章平均质量分 54
GAMBER_123
这个作者很懒,什么都没留下…
展开
-
梯度下降法
原理(这里写的超级简单,本来也是一个简单的理解):目标:优化损失函数,最小化损失函数。方法:利用梯度信息来寻找合适解。而这个梯度是一个周围的局部信息,而这个梯度是小于0的时候,沿着这个梯度的方向走,就可以使这个函数值变小。如果我们需要优化的参数是x的话,那么我们更新这个参数,改变量为:其中,△x是>0的,而α是大于0的,是一个超参数,用于调整每一次更新的步长,称为学习率。过程:1.先给参数赋予初始值,作为优化的起点;2.计算损失函数值;3.求导,确定梯度;原创 2022-11-14 17:31:26 · 188 阅读 · 0 评论 -
交叉熵损失(cross entropy)
其中,p,q分别表示数据标签的真实分布和预测出的分布,也就是p(yi|xi)表示样本xi的真实分布。具体一点,样本xi是属于某个类别ck,那么,p(yi=ci|xi)=1,其他都为0.类比,q(y^i|xi)表示样本xi在各个类别上的概率分布,此时,预测的概率处于【0,1】之间,当然y^i跑遍所有类别后,和为1.yi属于{0,1},那么样本xi属于类别1的概率为:q(yi=1|xi),样本xi属于0的概率为:1-q(yi=1|xi)这样,本质上就变成了,原创 2022-11-14 14:40:47 · 1096 阅读 · 0 评论 -
假设检验学习【合集】(一)
为什么要假设检验?为了推断某些总体未知的特性,提出某些关于总体的假设。(条件:总体的分布未知或者只知其形式)并根据样本对所提出的假设作出是接受还是拒绝的决策。经典例题【测量净重来检测机器知否有故障】产品的净重是一个随机变量,它服从正态分布(只知总体的分布形式);当机器正常,产品均值为0.5kg,标准差为0.015kg。某日,我们想知道机器是否正常?随机抽取9个产品,净重分别为(0.497 0.506 0.518 0.524 0.498 0.511 0.520 .0515 0.512)我们单纯的原创 2021-07-06 11:44:19 · 503 阅读 · 0 评论