
概念
拙小拙
这个作者很懒,什么都没留下…
展开
-
使用统计假设检验验证。
使用统计假设检验验证。翻译 2020-05-02 08:44:05 · 614 阅读 · 0 评论 -
名词性的简单解释
帕累托最优(Pareto Optimality):固有资源下,不使任何人变坏的前提下,使至少一个人变好。转载 2020-06-10 07:55:00 · 371 阅读 · 0 评论 -
SSR、SSE、SST、R^2、调整R^2
R2R^2R2与调整后R2R^2R2计算公式如下。详解方差分析表(ANOVA)(二) —— SST、SSE、SSR和它们的自由度SSR、SSE、SST、判定系数(可决系数、拟合优度)的计算公式数学建模学习交流转载 2020-05-26 06:51:31 · 30332 阅读 · 0 评论 -
数据预处理
文章目录数据预处理特征选择特征提取数据预处理特征选择选择重要的属性集合特征提取对属性进行重新组合,获得新的属性转载 2020-05-17 23:44:13 · 605 阅读 · 0 评论 -
超参数优化
1.网格搜索将参数依次尝试2.随机搜索随机选择网格内参数3.贝叶斯优化跟踪过去的评估结果使用结果形成概率模型,超参数映射到目标函数的概率得分,称为目标函数的代理a.为什么形成代理?答:代理比目标函数更容易优化,减少计算机资源吧b.工作流程建立目标函数的替代概率模型怎么替代的?找到在代理上表现最佳的超参数怎么评估是最佳的?将这些超参数应用于真正的目标函数更新包含新结果...转载 2019-12-13 19:24:45 · 248 阅读 · 0 评论 -
统计学基础2
转载 2020-03-22 22:32:44 · 117 阅读 · 0 评论 -
统计学基础1
转载 2020-03-16 12:09:29 · 134 阅读 · 0 评论 -
各种检验
Durbin-Watson检验邻近的观测值之间有无相关性。我们一般按照调查顺序录入数据,将第一位受试者录入到第一行,再将第二位受试者录入到第二行。在这种情况下,Durbin-Watson检验可以检测出第一位受试者和第二位受试者之间的相关性。但是如果我们乱序录入数据,将第一位受试者和可能与他存在自相关的第二位受试者离得很远,Durbin-Watson检验的结果就不准确了。一般来说,D...转载 2020-03-15 11:34:02 · 537 阅读 · 0 评论 -
Maximal Information-based Nonparametric Exploration(MINE)基于非参数检验的最大信息
互信息(Mutual Information)是信息论里一种有用的信息度量,它可以看成是一个随机变量中包含的关于另一个随机变量的信息量,或者说是一个随机变量由于已知另一个随机变量而减少的不肯定性。最大信息系数(MIC Maximal Information Coefficient )把两个 随机变量化成散点图,然后不断的用小方格子去分割。然后计算每个方格子里面的落入概率。在某种意义上,就...转载 2019-12-28 20:27:57 · 772 阅读 · 0 评论 -
特征选择适用条件
特征选择需求描述:特征选择方法及适用条件:过滤式方差选择法:适用于离散型数据。 主要是去掉方差较小的特征,因为方差小表明该特征的取值差异不大。卡方检验法:定性变量。自变量和因变量都是被分好类的数据。 卡方检验值越大,相关性越强。皮尔森相关系数法:相关系数绝对值越大,相关性越强最大信息系数法:建议作为分类问题的分类变量的筛选方法(可适用于离散或连续型特征)。具体数据...翻译 2019-12-28 10:57:09 · 884 阅读 · 0 评论 -
显著性 p值
显著性水平:指当原假设为正确时人们却把它拒绝了的概率或风险。越小越好p值:是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。...转载 2019-12-22 17:16:43 · 2499 阅读 · 0 评论 -
多重共线性一些指标解释
ANOVA中F检验是对整个模型而已的,看是不是自变量系数不全为0,这里F检验值23,对应P概率=0,显著性P<0.05,H1成立,说明显著性非常高系数中t检验则是分别针对某个自变量的,看每个自变量是否有显著预测效力。这里t检验对应概率大于0.05,即显著性一列为0.23和0.48,说明显著性很差SPSS对于多重共线性的判断指标有以下几种:容忍度(Tolerance)、方差膨胀因子(V...转载 2019-12-22 13:21:54 · 12988 阅读 · 0 评论 -
目标函数与损失函数
目标函数目标函数f(x)就是用设计变量来表示的所追求的目标形式,所以目标函数就是设计变量的函数,是一个标量。从工程意义讲,目标函数是系统的性能标准。机器学习中所有的算法都需要最大化或最小化一个函数,这个函数被称为“目标函数”。其中,我们一般把最小化的一类函数,称为“损失函数”。损失函数损失函数(loss function)或代价函数(cost function)是将随机事件或其...翻译 2019-12-13 19:09:25 · 1130 阅读 · 0 评论 -
梯度与导数
梯度:梯度是一个向量(矢量),表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(此梯度的方向)变化最快,变化率最大(为该梯度的模)。导数:导数(Derivative),也叫导函数值。又名微商,是微积分中的重要基础概念。导数是函数的局部性质。一个函数在某一点的导数描述了这个函数在这一点附近的变化率。不是所有的函数都有导数,一个函数也不一定在所有的点上都有导...转载 2019-12-13 17:51:02 · 1882 阅读 · 0 评论