参数估计
点估计
直接指定总体分布的参数为某一值的估计的方法叫做点估计
区间估计
估计值具有一定范围的方法叫做区间估计。
置信水平、置信区间
置信水平时表示区间估计的区间可信度的概率。
满足某个置信水平的区间叫做置信区间。
对于同一组数据,置信水平越大,置信区间就越大。
置信上限
置信区间的下界值与上界值叫做置信界限。
区间估计
1.计算样本均值,自由度(容量-1)和误差
2.求置信区间stats.t.interval(alpha=0.95,df =df , loc =mu,scale= se)
alpha是置信水平,df是自由度,loc样本均值,scale为标准误差
# 自由度
df = len(fish) - 1
df
#9
# 标准误差
se = sigma / sp.sqrt(len(fish))
se
#0.261
# 区间估计
interval = stats.t.interval(
alpha = 0.95, df = df, loc = mu, scale = se)
interval
#(3.597, 4.777)
细节求解,查看概率论书籍
决定置信区间大小的因素
样本容量越大,自由度越大,标准误差越小。
如果完全相同的数据,那么置信水平越大,置信区间就会越大。
区间估计结果的解读
置信水平95%
1.从真正的总体中抽样;
2.使用区间估计,计算95%置信区间;
3.反复前两步;
4.所有试验所得的区间包含真正的参数的概率为u95%
参考资料
[日] 马场真哉 著, 吴昊天 译. 用Python动手学统计学[M]. 1. 人民邮电出版社, 2021-06-01.
菜鸟网站python3