
统计分析
文章平均质量分 56
呀呀培培
小小书童
展开
-
统计分析:变异系数
变异系数(Coefficient of variation)转载地址:变异系数什么是变异系数 变异系数又称“标准差率”,是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。 标准差与平均数的比值称为变异系数,记转载 2016-01-19 11:39:00 · 13140 阅读 · 1 评论 -
统计分析:偏度和峰度
偏度偏度(Skewness): 是对Sample构成的分布的对称性状况的描述。计算时间序列 xx 的偏度,偏度用于衡量 xx 的对称性。若偏度为负,则 xx 均值左侧的离散度比右侧强;若偏度为正,则 xx 均值左侧的离散度比右侧弱。对于正态分布(或严格对称分布)偏度等于 00。(a). Skewness 是对于分布的标准三阶中心距(standardized 3rd central moment)正态原创 2016-01-21 10:23:10 · 29522 阅读 · 1 评论 -
统计分析:模型评估和模型选择
机器学习算法 原理、实现与实战——模型评估与模型选择原文地址:http://www.cnblogs.com/ronny/p/4062792.html1. 训练误差与测试误差机器学习的目的是使学习到的模型不仅对已知数据而且对未知数据都能有很好的预测能力。 假设学习到的模型是Y=f^(X)Y = \hat{f}(X),训练误差是模型Y=f^(X)Y = \hat{f}(X)关于训练数据集的平均损失:转载 2016-01-22 10:22:01 · 4826 阅读 · 1 评论 -
统计分析:置信区间
决策树 TT 构建好后,需要估计预测准确率。直观说明,比如 NN 条测试数据,XX 预测正确的记录数,那么可以估计 acc=X/Nacc = X/N 为 TT 的准确率。但是,这样不是很科学。因为我们是通过样本估计的准确率,很有可能存在偏差。所以,比较科学的方法是估计一个准确率的区间,这里就要用到统计学中的置信区间(Confidence Interval)。设 TT 的准确率pp是一个客观存在的值,转载 2016-01-22 15:25:25 · 3687 阅读 · 0 评论