- 博客(5)
- 资源 (2)
- 收藏
- 关注
原创 相关关系、因果关系、回归关系的区别
相关关系和因果关系之间的区别两个变量之间存在相关关系,不一定说明两者之间存在着因果关系。因果关系,是指一个变量的存在一定会导致另一个变量的产生。而相关性是统计学上的一个概念,是指一个变量变化的同时,另一个因素也会伴随发生变化,但不能确定一个变量变化是不是另一个变量变化的原因。比如天气冷和下雪通常一起发生,说明两者有很强的相关性,但不能肯定是谁导致了谁,所以不确定两者是够有因果关系。
2015-06-17 22:48:17
50845
原创 置信区间、显著性检验和统计学意义
置信区间估计参数真值所在的范围通常以区间的形式给出,同时还给出此区间包含参数真值的可信程度,这种形式的估计称为区间估计,这样的区间称为置信区间。对于任意参数θ在可能的取值范围内,P{θ12}≥1-α,则称随机区间(θ1,θ2)是参数θ的置信水平为1-α的置信区间,θ1和θ2分别称为置信水平为1-α的双侧置信区间的置信下限和置信上限,1-α称为置信水平。对于特殊问题,我们关心的是重点在于
2015-06-17 22:43:22
37494
原创 准确率、召回率和F值的关系
在信息检索、统计分类、识别、预测、翻译等领域,两个最基本指标是准确率和召回率,用来评价结果的质量。准确率(Precision),又称“精度”、“正确率”、“查准率”,表示在检索到的所有文档中,检索到的相关文档所占的比例。召回率(Recall),又称“查全率”,表示在所有相关文档中,检索到的相关文档所占的比率。两者的公式为:准确率 = 检索到的相关文档数量 / 检索到的所有文档总数
2015-05-22 22:48:21
11512
原创 最大似然估计、最大后验估计和贝叶斯估计的关系
最大似然估计(MLE)原理:设X1, X2…Xn是取自总体X的一个样本,样本的联合密度(连续型)或联合概率密度(离散型)为f(X1, X2…Xn; Θ)。当给定样本X1, X2…Xn时,定义似然函数为L(Θ)= f(X1, X2…Xn; Θ)。L(Θ)看作参数Θ的函数,极大似然估计法就是用使L(Θ)达到最大值的去估计真实值Θ。L()=,称为Θ的极大似然估计(MLE)。最大似然估计中采样
2015-05-22 22:37:40
5531
原创 归一化、标准化和正则化的关系
归一化(Normalization)1.把数据变为(0,1)之间的小数。主要是为了方便数据处理,因为将数据映射到0~1范围之内,可以使处理过程更加便捷、快速。2.把有量纲表达式变换为无量纲表达式,成为纯量。经过归一化处理的数据,处于同一数量级,可以消除指标之间的量纲和量纲单位的影响,提高不同数据指标之间的可比性。主要算法:1.线性转换,即min-max归一化(常用方法)y=(x
2015-05-22 22:33:33
32133
2
mt及详细教程
2012-02-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人